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本 书 的 读者 群 为 中 小 学 教师 。 

试卷 分 析 包 括 “ 试 卷 质 量 分 析 ” 和 “测验 成 绩 分 析 ” 两 大 部 分 。 
进行 试卷 分 析 所 依据 的 测量 理论 不 同 , 所 得 的 结论 也 会 有 较 大 的 
差异 。 

目前 应 用 广泛 的 测量 理论 主要 有 :(1) 经 典 真 分 数理 论 ,(2) 概 
化 理论 ,(3) 试 题 反 应 理论 。 每 种 理论 都 有 其 应 用 范围 ,各自 的 优点 
与 不 足 。 考 虑 到 中 小 学 教师 主要 了 解 经 典 真 分 数理 论 ,而 且 平 时 使 
用 的 试卷 分 析 也 主要 基于 经 典 真 分 数理 论 ,本 书 主要 介绍 经 典 真 分 
数理 论 及 其 应 用 。 概 化 理论 和 试题 反应 理论 则 只 做 简要 介绍 ,目的 
是 希望 一 线 教师 对 测量 理论 的 发 展 有 所 了 解 。 

本 书 共计 五 章 。 第 一 章 是 本 书 的 理论 基础 ,包括 三 节 ,主要 介 
绍 经 典 真 分 数理 论 的 基本 内 容 、 优 点 与 局 限 ,以 及 应 用 时 应 注意 的 
间 题 ;教育 测验 的 基本 常识 ;教育 统计 的 基本 常识 。 概 化 理论 和 试 
题 反 应 理论 的 介绍 则 放 在 附录 部 分 , 供 查 阅 。 第 二 章 介绍 试卷 分 析 
中 的 命题 质量 分 析 , 结 合 具体 案例 详细 剖析 了 四 个 基本 技术 指标 
《信和 度 、 效 度 、 难 度 、 区 分 度 )。 第 三 、 四 章 侧重 于 介绍 试卷 分 析 中 的 
测验 成 绩 分 析 , 其 中 第 三 章 主要 介绍 运用 描述 统计 方法 (统计 图 、 统 
计 表 、 集 中 量 数 、 差 异 量 数 等 ) 对 测验 成 绩 进行 组 织 . 表 达 、 整 理 与 概 
括 ; 第 四 章 主要 介绍 运用 常见 的 基本 推断 统计 方法 (相关 分 析 、 回 归 
分 析 、 方 差分 析 ) 对 经 过 整理 与 概括 的 测验 成 绩 做 较为 深入 的 分 析 ， 
为 后 继 教 与 学 的 决策 提供 依据 。 第 五 章 依据 前 四 章 介绍 的 基本 测 
量 理论 、 统 计 和 评价 技术 ,以 案例 分 析 的 方式 介绍 中 小 学 数学 教学 
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中 常见 测验 的 试卷 分 析 方 法 ,重点 放 在 根据 教师 自 编 测 验 卷 或 统考 
测验 卷 ,运用 测验 分 析 技 术 , 协 助教 师 掌 握 基 本 的 数据 收集 处理、 
分 析 方 法 ,用 于 诊断 教师 教学 、 学 生 学 习 状 况 ,以 便 改 进 以 后 的 教 
学 ,并 尝试 给 出 实用 的 试卷 分 析 报 告 模 板 。 

目前 中 小 学 教师 接触 较 多 的 数据 处 理 软 件 主要 有 EXCEL 软件 
与 SPSS 软件 ,两 种 软件 操作 都 比较 方便 。 为 了 方便 教师 更 好 地 学 
习 与 使 用 书 中 的 技术 与 方法 ,本 书 详 细 呈 现 使 用 EXCEL 软件 与 
SPSS 软件 计算 命题 质量 技术 指标 .制作 统计 图 表 、 计 算 统 计量 、 进 
行 基本 统计 分 析 的 具体 操作 步骤 ,努力 体现 实 操 性 、 应 用 性 ,力争 为 
中 小 学 教师 提供 工作 便利 。 

考虑 到 本 书 的 读者 是 中 小 学 教师 ,主要 从 事实 际 的 教学 工作 ， 
难以 有 时 间 从 头 到 尾 集中 阅读 ,使 用 本 书 时 建议 读者 从 书 中 案例 入 
手 , 在 模仿 与 操作 的 过 程 中 理解 基本 的 测量 与 评价 专业 知识 ,然后 
再 学 习 并 加 深 对 有 关 理 论 的 认识 。 

本 书 的 结构 框架 由 许 世 红 、 胡 中 锋 共 同 构思 , 许 世 红 完成 初稿 ， 
胡 中 锋 审 阅 全 部 稿件 。 广 州 大 学 附属 中 学 施 永 红 老 师 、 广 州 市 五 羊 
中 学 高 惠 平 老师 、 广 州 市 文 德 路 小 学 黄 丽 芳 副 校 长 等 为 本 书 案例 提 
供 了 详尽 的 素材 与 数据 ,并 审阅 了 有 关 章 节 , 在 此 谨 致 谢意 。 

本 书 编著 过 程 中 ,参阅 了 不 少 文献 ,并 引用 了 其 中 一 些 资料 ,有 
些 未 在 正文 中 一 一 标注 ,说 在 书后 参考 文献 中 列 出 ,一 并 表示 感谢 。 

由 于 时 间 仓促 , 书 中 难免 存在 情 疝 , 祈 请 各 方 专家 与 同行 不 宕 
赐教 ,并 欢迎 广大 读者 批评 指正 。 


许 世 红 ” 胡 中 锋 
2009 年 8 月 于 广州 
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现代 教育 发 展 至 21 世纪 ,检验 基础 教育 阶段 一 线 教 师 教学 基 
本 功底 情况 ,虽然 还 是 从 “备课 、 上 课 , 批 改作 业 、 出 测验 卷 、 进 行 试 
卷 质 量 分 析 ” 等 环节 着 手 , 但 各 个 环节 的 评价 内 容 、 评 价 标准 已 经 有 
了 巨大 的 变化 。 教 育 测量 在 检验 教学 效果 、 评 估 学 业 成 就 等 方面 应 
极为 普遍 ,掌握 基本 的 测量 理论 并 正确 应 用 测量 理论 检验 、 反 馈 、 指 
导 教学 活动 的 开展 成 为 现代 合格 教师 应 该 具备 的 基本 技能 。 

本 章 主要 从 真 分 数 模型 、 真 分 数理 论 的 优点 、 真 分 数理 论 的 缺 
陷 、 真 分 数理 论 应 用 时 应 注意 的 问题 等 方面 介绍 在 日 常 教学 实践 中 
应 用 广泛 的 经 典 真 分 数理 论 。 另 外 ,结合 学 校 实际 需要 ,简要 介绍 
教育 测验 .教育 统计 的 一 些 基本 常识 。 












































第 一 节 经典 真 分 数理 论 


一 、 能 力 及 其 可 测 性 


在 日 常生 话 中 ,人 的 身高 .体重 等 特征 都 比较 容易 测量 ,因为 这 
生理 属性 比较 稳定 直观 ,所 需要 用 的 测量 工具 也 容易 制作 和 使 
。 人 们 也 尝试 去 测量 诸如 天 赋 、 管 力 、 动 机、 性 格 等 方面 的 人 的 心 
特征 ,在 教育 测试 中 ,我 们 常常 把 要 测量 的 这 种 心理 特征 称 为 能 
力 。 能 力 即 完成 一 组 特定 认 知 任务 所 表现 出 的 相对 稳定 的 思维 或 
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行为 方式 ,由 于 这 种 能 力 往 往 与 学 生 学 习 的 具体 科目 相 联系 ,因此 ， 
就 有 了 数学 能 力 .语文 能 力 、 物 理 能 力 等 之 分 ,有 时 候 也 会 把 某 种 能 
力 进行 分 解 ,例如 数学 能 力 进一步 分 解 为 计算 能 力 、 推 理 能 力 、 空 间 
想象 能 力 等 。 

通常 ,我 们 假定 人 与 人 之 间 的 能 力 有 差异 ,这 种 差异 与 人 们 完 
成 一 定 难度 任务 的 正确 程度 相关 。 一 般 情况 下 ,对 有 一 定 难度 的 任 
务 , 能 力 高 的 人 正确 完成 的 概率 高 ,能 力 低 的 人 正确 完成 的 概率 低 。 
类 似 地 ,对 于 具有 一 定 能 力 的 人 ,正确 完成 高 难度 任务 的 概率 较 低 ， 
而 正确 完成 低 难度 任务 的 概率 较 高 。 
由 于 能 力 没有 明确 的 物理 与 生理 属性 ,无 法 直接 测量 ,因此 人 
们 设计 出 特定 的 测量 量 表 (如 数学 测验 卷 ) ,通过 分 析 考 生 解 答 测验 
卷 题目 的 过 程 与 结果 情况 (如 考生 数学 测验 的 答卷 情况 ) 来 推测 考 
生 具 备 某 种 能 力 (如 某 个 阶段 某 类 数学 能 力 ) 的 特点 与 水 平 。 

需要 明确 的 是 ,无 论 教育 考试 测量 的 是 何 种 能 力 ,考试 测量 得 
到 的 数据 只 是 考生 某 个 方面 能 力 的 一 个 估计 值 , 单 凭 这 个 估计 值 往 
往 无 法 全 面 衡量 考生 的 真实 学 习 状 况 。 


二 、 测验 分 数 的 真 分 数 模型 


为 了 了 解 学 生 的 学 习 能 力 状况 ,我 们 组 织 考试 对 学 生 进行 考 
查 。 经 过 考试 测量 后 ,学 生 的 学 习 能 力 体现 为 一 个 数值 。 然 而 ,由 
于 测量 误差 的 存在 ,实际 测 得 的 数值 往往 与 学 习 能 力 的 真实 水 平 不 
完全 一 致 。 例 如 ,我 们 常常 说 “X X 考生 基本 上 考 出 了 应 有 水 平 ”、 
“XX 考生 这 次 测验 超 水 平 发 挥 "“X X 考生 的 学 习 状 况 基本 上 测 
出 来 了 ”等 ,就 是 对 这 种 测量 现象 的 一 种 描述 。 

为 了 研究 方便 ,我 们 把 反映 学 生 学 习 能 力 真实 水 平 的 那个 数值 
称 为 学 习 能 力 的 真 分 数 , 把 实际 测量 得 到 的 分 数 称 为 学 习 能 力 的 实 
测 分 数 ,把 实测 分 数 与 真 分 数 之 间 的 差 值 称 为 测量 误差 。 当 实测 分 
数 与 真 分 数 很 接近 时 ,就 说 这 次 测量 的 误差 很 小 。 由 此 ,我 们 得 到 
关于 真 分 数 假设 的 数学 模型 : 
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假设 1 zx; = 二 tt 十 ei。 (1.1) 

其 中 ,x; 表示 在 某 次 考试 中 考生 i 能 力 的 实测 分 数 ,t; 表示 考生 
i 能力 的 真 分 数 ,e; 表示 考试 中 的 误差 分 数 。 

真 分 数 的 数学 模型 1. 1 与 人 们 在 物理 量 测量 中 的 感性 经 验 相 

合 ,而 且 表 达 式 为 和 式 , 在 数字 计算 中 使 用 非常 方便 。 

与 模型 1. 1 同时 提出 的 还 有 3 个 相关 联 的 基本 假设 ， 

假设 2 真 分 数 不 变 ,是 一 个 常数 。 

在 讨论 具体 的 能 力 测试 时 ,我 们 假定 每 个 考生 的 真实 能 力 是 不 
变 的 ,是 一 个 确定 值 。 在 研究 一 大 群 考生 时 ,一 般 情况 下 ,假定 考生 
的 真实 能 力 的 分 布 状况 服从 正 态 分 布 。 

假设 3 反复 施 测 时 ,误差 分 数 相互 独立 , 且 服 从 期 望 为 零 的 正 
态 分 布 。 

考生 的 能 力 真 分 数 是 无 法 直接 得 到 的 。 根 据 假设 3, 同 一 测验 
反复 施 测 时 ,误差 分 数 呈 零 相关 , 即 p(e，e ) = 0。 既然 误差 分 数 取 
值 是 服从 期 望 为 零 的 正 态 分 布 ( 即 E(e) = 0 ) ,那么 ,如 果 能 够 求 出 
误差 分 数 方差 ,就 能 以 实测 分 数 为 中 点 ,以 误差 分 数 标准 差 为 半 长 ， 
对 能 力 真 分 数 取 值 进行 区 间 估 计 。 

假设 4 用 平行 测验 对 同一 总 体 考生 施 测 后 ,所 得 实测 分 数 的 
平均 数 与 方差 相等 。 

从 理论 上 讲 , 如 果 一 组 测验 测量 的 是 同一 种 能 力 ,那么 在 控制 
方差 能 力 相同 的 情况 下 ,这 组 测验 所 测 得 的 实测 分 数 就 应 具有 相同 
的 分 布 , 即 不 同 测验 的 实测 分 数 具 有 相同 的 平均 数 与 标准 差 ,这 样 
的 一 组 测验 就 称 为 平行 测验 。 

根据 上 述 四 个 假设 ,我 们 立即 可 以 得 出 以 下 几 个 重要 结论 ,这 
些 结论 构成 了 真 分 数理 论 的 基石 。 

推论 1 真 分 数 等 于 实测 分 数 的 期 望 值 , 即 ! = ECz) 。 

推论 2 真 分 数 与 误差 分 数 彼此 独立 , 即 p(z, e) 一 0。 

推论 3 实测 分 数 的 方差 等 于 真 分 数 方差 与 误差 分 数 方差 之 
和 , 即 o: = @ 十 oi。 
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推论 4 平行 测验 的 真 分 数 平均 数 相等 , 真 分 数 标准 差 相 等 。 

推论 5 平行 测验 向 考生 总 体 施 测 后 ,个 体内 的 误差 分 数 标准 
差 等 于 每 个 测验 的 误差 分 数 标准 差 。 

推论 6 在 一 组 平行 测验 中 ,任意 两 个 平行 测验 间 的 相关 均 相 等 。 

【 例 1-1】 根据 上 述 假设 与 推论 ,我 们 构建 一 个 施 测 的 模型 。 
假设 有 一 个 考生 总 体 , 它 由 m 个 考生 构成 ,这 m 个 考生 参加 了 7 次 
平行 测验 ,得 到 的 实测 分 数 构成 表 1 - 1 所 示 的 数字 矩阵 。 

在 表 1 -1 中 ,考生 ;参加 一 组 平行 测验 所 得 的 实测 分 数 z, (i = 
1, 2,…，m) 可 以 表示 成 zi = Ti 十 Ey ,j= 1,2,…, n。 其 中 , 考 
生 i 参加 一 组 平行 测验 的 个 体 真 分 数 是 一 个 确定 值 T, , 它 不 随 测验 
的 改变 而 改变 。 由 于 这 组 平行 测验 测量 的 是 同一 种 能 力 ,因此 每 个 
测验 的 真 分 数 平均 数 都 是 工 , 真 分 数 标准 差 都 是 sr。 因 为 误差 方差 
大 小 仅 取决 于 测验 控制 误差 的 能 力 , 且 平 行 测验 假定 误差 控制 能 力 
相等 ,所 以 ,单一 测验 内 的 个 体 间 误 差分 数 方差 等 于 这 个 平行 测 
验 向 某 个 考生 施 测 后 所 得 误差 分 数 方差 , 即 标准 差 都 相等 , 均 是 ot。 

表 1-1 一 群 考生 参加 一 组 平行 测验 所 得 分 数 矩 阵 
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根据 表 1 - 1, 如 果 测 验 对 误差 控制 得 很 好 ,那么 用 这 个 平行 
测验 向 一 组 考生 施 测 ,所 得 的 实测 分 数 就 会 毫 无 偏差 地 传达 考生 真 
实 能 力 的 信息 ,实测 分 数 实际 上 就 是 表达 在 另 一 量 尺 上 的 真 分 数 的 
线性 变换 值 ,这 时 ,就 称 测验 性 能 良好 。 因 此 ,我 们 可 以 通过 研究 两 
个 平行 测验 所 得 的 实测 分 数 之 间 的 相关 性 ,分 析 测 验 结果 的 一 致 性 
与 可 靠 性 ,以 及 测验 误差 的 控制 情况 ,这 些 相关 性 研究 就 是 所 要 估 
计 的 各 种 可 能 信 度 指数 、 信 度 系数 等 问题 ,因此 ,人 们 也 称 真 分 数理 
论 为 经 典 信 度 理论 。 

除了 信 度 估计 外 , 真 分 数理 论 也 探讨 其 他 相关 的 测量 学 问题 ， 
如 : 效 度 、 测 验 编制 . 常 模 、 测 验 等 值 , 测 验 偏差 .试题 分 析 、 常 模 参照 
测验 ,标准 参照 测验 、 适 应 性 测验 、 题 库 建 设 等 等 ,本 书 主要 应 用 真 
分 数理 论 研 究 试 卷 的 分 析 方 法 ,涉及 的 主要 是 真 分 数理 论 中 有 关 信 
度 、 效 度 、 试 题 分 析 等 部 分 的 基本 概念 与 基本 方法 。 


三 、 真 分 数理 论 的 优点 


经 典 真 分 数理 论 属 于 早期 心理 计量 学 理论 , 它 形成 于 20 世纪 
初 ,成 熟 于 20 世纪 50 年 代 ,其 基本 目的 是 要 形成 一 种 可 操作 的 估计 
测验 分 数 测量 精度 的 方法 , 它 的 数学 模型 简单 易 懂 ,在 实际 工作 中 
应 用 广泛 ,在 我 国 的 教育 测量 与 评价 实践 中 仍 占据 主要 地 位 。 具 体 
而 言 , 该 理论 的 优点 主要 体现 在 以 下 三 个 方面 。 

1. 以 弱 假 设 为 基础 ,突出 主要 矛盾 

真 分 数理 论 产生 之 初 ,模仿 物理 测量 的 思路 ,按照 “ 真 值 就 是 反 
复 测 重 的 期 望 值 ”构建 计量 模型 ,突出 “主要 通过 外 部 控制 测验 误 
差 .提高 实测 分 数 的 精度 ,从 而 提高 对 真实 分 数 的 估计 精度 ”的 研究 
主线 , 抓 住 主要 矛盾 ,弱化 其 他 的 问题 (如 对 误差 来 源 的 具体 分 析 ， 
对 测验 分 数 的 单位 等 值 要 求 , 对 平行 测验 的 严格 检验 等 ) ,对 学 业 成 
就 进行 整体 性 笼统 的 总 分 评价 ,通过 将 考生 简单 地 当做 一 个 整体 在 
同一 量 尺 上 排队 加 以 分 析 , 在 测验 编制 ,分 数 解释 、 效 度 验 证 等 具体 
工作 中 发 挥 了 重要 指导 作用 , 较 好 地 满足 了 实际 工作 的 需要 。 
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2. 采取 概率 的 观点 构建 模型 ,把 心理 变量 间 的 关系 视 为 随 


机 变量 间 的 关系 
真 分 数 模 型 X 一 工 十 瑟 中 ,实测 分 数 和 = (zi， zi， …, x,), 真 
分 数 了 一 (41， ty，…， 4) 与 误差 分 数 玉 二 (el, e,，…, 6,) 都 是 随 


机 变量 。 平 行 测验 中 , 由 于 随机 因素 的 影响 ,测验 结果 往往 会 有 不 
同 的 数值 ,采用 随机 变量 就 可 以 描述 平行 测验 中 测验 结果 的 差异 
性 ,这 样 , 既 可 以 借助 概率 知识 研究 测验 结果 的 规律 性 ,又 可 以 借用 
数学 函数 等 工具 刻画 测验 中 各 因素 之 间 的 内 在 联系 。 这 种 研究 方 
法 反映 出 心理 与 教育 测量 的 科学 取向 。 

3. 进一步 拓展 了 对 测量 效 度 、 测 验 公平 性 与 测验 等 值 等 问 
题 的 探索 

随 着 社会 ,政治 经济、 文化 的 发 展 ,人 们 对 测验 内 容 、 测 验 功 
能 、 测 验 适 用 面 、 测 验 精 度 等 的 要 求 越 来 越 高 , 真 分 数理 论 也 根据 实 
际 需 要 自觉 地 开展 了 相关 问题 的 理论 与 实践 研究 ,贡献 出 特定 而 且 
有 力 的 概念 ,原理 与 方法 , 因此 , 真 分 数理 论 仍 显示 出 很 强 的 生 
命 力 。 


四 、 真 分 数理 论 的 局 限 


虽然 真 分 数理 论 无 论 在 理论 的 基础 研究 方面 还 是 在 实践 的 具 
体 指导 方面 , 均 为 心理 与 教育 测量 的 发 展 做 出 了 巨大 贡献 ,但 是 它 
的 理论 框架 存在 明显 的 先天 缺陷 ,在 测验 实践 飞速 发 展 的 今天 已 经 
日 益 显 示 出 其 局 限 性 。 

1 计量 模型 建立 在 考生 答题 的 外 在 表现 上 ,导致 各 项 测验 
性 能 指标 严重 依赖 样本 

真 分 数 模型 X = 了 十 正中 ,实测 分 数 X 反映 的 是 考生 在 测验 中 
的 外 在 具体 表现 ,在 具体 分 析 误差 分 数 已 时 也 侧重 于 研究 1 外 在 因 
素 引起 的 随机 误差 的 控制 ,因此 ,基于 真 分 数 计量 模型 而 界定 的 测 
验 信和 度 , 效 度 、 区 分 度 、 难 度 等 测验 性 能 指标 也 依赖 于 考生 群体 的 具 
体 表现 。 例如 , 真 分 数理 论 把 测验 信和 度 定义 为 实测 分 数 与 真 分 数 的 
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相关 性 ,而 相关 系数 的 计算 受 样本 数据 取 值 全 距 范 围 大 小 的 影响 ， 
因此 也 就 极其 依赖 样本 ;又 如 , 真 分 数理 论 把 试题 难度 定义 为 考生 
样本 组 上 的 通过 率 ,如 果 考 生 样 本 组 的 水 平 高 , 则 难度 就 小 ,反之 ， 
则 难度 大 ,难度 的 计算 结果 严重 依赖 样本 组 。 这 样 ,测验 的 结果 只 
能 推广 到 与 考生 样本 组 非常 类 似 的 群体 中 ,其 适用 推广 范围 非常 
有 限 。 

2. 所 测 能 力 的 不 变性 、 反 复 测试 中 误差 分 数 相互 独立 性 、 严 
格 平行 测验 等 假设 在 实践 中 难以 满足 

真 分 数理 论 源 于 物理 测量 的 研究 ,但 是 心理 与 教育 测量 的 对 象 
是 人 , 它 与 物理 测量 对 象 “ 物 ”之 间 有 着 本 质 的 区 别 。 首 先 ,所 测 的 
对 象 都 是 内 陷于 个 体内 部 的 特质 ,测量 所 能 直接 观测 的 只 是 这 些 内 
部 特质 的 外 在 表现 ,因此 ,只 能 是 间接 测量 。 其 次 ,测量 的 过 程 中 ， 
考生 的 记忆 ,遗忘 发展 新 技巧 等 心理 因素 都 会 主动 产生 作用 ,所 
以 ,多 次 施 测 甚至 前 一 部 分 试题 的 施 测 , 都 会 对 考生 产生 启发 与 练 
习 等 作用 ,进而 对 后 续 测验 与 试题 产生 影响 。 另 外 ,测试 题目 的 代 
表 性 、 测 验 分 数 的 评定 、 施 测 的 时 空 条 件 等 因素 ,也 会 带 来 影响 。 这 
样 , 真 分 数理 论 的 基本 假设 就 很 难 满 足 , 基 于 真 分 数理 论 的 数据 分 
析 就 显得 很 粗糙 ,误差 较 大 。 

3， 基于 严格 平行 测验 等 定义 的 测验 信 度 及 相关 计算 较为 粗略 

真 分 数理 论 中 ,测验 信和 度 的 界定 建立 在 平行 测验 的 基础 上 。 
于 实际 操作 中 平行 测验 难以 满足 ,因此 测验 信和 度 也 就 不 够 准确 。 另 
外 ,利用 同一 测验 采用 重 测 、 复 本 、 折 半 等 不 同方 法 计算 可 以 得 到 多 
个 信和 度 系数 ,结果 就 出 现 了 多 个 测量 标准 误 值 的 复 粹 局 面 。 

4. 试题 难度 与 考生 能 力 水 平 值 定义 在 不 同 的 量 尺 上 

真 分 数理 论 的 试题 难度 是 考生 组 的 通过 率 , 参 照 系 是 某 一 个 考 
生 样 本 组 。 而 考生 能 力 水 平 值 用 测验 的 总 得 分 (或 试卷 中 的 试题 通 
过 率 ) 来 表示 ,参照 系 是 某 一 组 试题 。 由 于 考生 样本 组 与 某 一 试题 
组 彼此 互 不 隶属 ,因此 ,一 道 试题 的 难度 为 0. 55, 只 能 解释 为 某 一 个 
考生 样本 组 中 有 55%% 的 考生 答对 了 该 试题 , 却 不 能 反映 答对 该 题目 
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的 考生 能 力 的 高 与 低 , 即 试题 难度 与 考生 能 力 建立 在 不 同 的 量 尺 
上 。 事 实 上 ,人 们 希望 试题 的 难度 应 反映 考生 正确 作答 的 能 力 水 
平 , 通 过 试题 难度 可 以 直接 比较 考生 的 能 力 高 低 , 而 真 分 数理 论 显 
然 没 有 解决 这 一 问题 。 


五 、 应 用 真 分 数理 论 应 注意 的 问题 


虽然 真 分 数理 论 存在 诸多 的 局 限 性 ,但 是 由 于 该 理论 通俗 易 
懂 , 可 操作 性 强 ,在 我 国 的 教育 实践 领域 应 用 很 广泛 。 应 用 真 分 数 
理论 开展 教育 测验 与 评价 时 ,需要 注意 以 下 几 点 问题 。 

1. 测验 卷 制作 应 体现 较为 清晰 的 参 腿 标准 

每 一 种 教育 测验 都 有 其 特定 的 目的 、 功 能 及 适用 范围 。 例 如 ， 
常 模 参 照 测验 以 全 体 考生 在 某 一 大 规模 测验 中 所 得 到 的 成 绩 分 布 
为 标准 ,衡量 考生 在 这 一 测验 上 所 得 到 的 成 绩 在 全 体 成 绩 分 布 中 所 
处 的 地 位 , 它 主 要 适用 于 大 规模 的 选拔 性 考试 ,如 中 考 、 高 考 等 ; 标 
准 参照 测验 是 以 考生 对 测验 目标 或 内 容 的 掌握 程度 作为 标准 ,对 测 
验 分 数 进行 解释 ,如 学 科 的 单元 测验 、 学 期 测验 等 。 在 编制 测验 卷 
时 ,要 明确 测验 的 性 质 与 功能 ,确保 测验 使 用 与 解释 的 合理 性 。 

2. 实施 测验 时 尽量 避免 无 关 因 素 干 扰 

为 了 保证 测验 结果 的 有 效 性 与 可 靠 性 ,除了 把 好 测验 卷 编 制 质 
量 关 外 ,严格 控制 测验 实施 过 程 ,确保 实施 过 程 的 公平 性 与 合理 性 ， 
也 有 利于 考生 在 完成 相应 的 测验 时 顺利 展示 应 有 的 能 力 与 水 平 。 
因此 ,实施 测验 时 ,应 按照 测验 实施 规定 的 要 求 进行 ,严格 控制 这 一 
过 程 中 可 能 出 现 的 各 种 无 关 因素 的 干扰 ,如 测验 卷 的 发 放 、 考 试 时 
间 的 控制 . 作 星 行 为 的 监控 ,测验 环 境 的 选择 等 ,确保 测验 结果 的 可 
靠 性 。 

3. 正确 认识 测验 结果 

人 们 总 是 希望 测验 结果 是 考生 能 力 的 最 好 测度 ,在 解释 测验 结 
果 时 ,往往 将 测验 分 数 的 高 低 与 考生 能 力 的 高 低 直接 对 等 ,仿佛 这 
种 做 法 , 即 根据 测验 结果 评价 考生 , 比 其 他 评价 方法 显得 更 加 公平 、 
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公正 。 但 从 教育 测量 角度 来 看 ,对 测验 结果 的 认识 需要 综合 考虑 多 
种 因素 。 首先, 测验 结果 除了 与 考生 在 学 校 学 习 状 况 相关 外 ,还 受 
家 庭 情况 ,考生 生理 与 健康 情况 等 因素 的 影响 ,如 果 测 验 结果 出 现 
异常 ,需要 从 多 个 角度 寻找 原因 。 其 次 ,测验 结果 的 解释 应 放 在 考 
生 群 体 中 进行 分 析 , 脱 离 考生 群体 单独 谈论 某 一 个 测验 分 数 的 高 
低 , 其 价值 很 有 限 。 另 外 ,测验 结果 是 对 考生 能 力 的 间接 反映 , 它 受 
限于 试题 命 制 状况 ,也 受 评 卷 过 程 影响 ,解释 测验 结果 时 ,也 需要 交 
待 这 些 相关 因素 。 




















第 二 节 教育 测验 简介 


由 于 使 用 目的 与 需求 的 不 同 ,测验 发 展 至 今 ,已 经 有 多 种 分 类 。 
本 书 主要 探讨 学 校 教 学 领域 中 的 试卷 分 析 方 法 ,相应 地 ,探讨 的 重 
心 限于 教育 测验 。 本 书 中 的 教育 测验 指 学 生 在 学 校 接 受 学 科学 习 
与 训练 后 ,对 学 生 所 获得 知识 .技能 与 能 力 状况 进行 考核 ,并 将 考核 
结果 转化 为 数量 描述 的 过 程 。 


一 、 教 育 测验 的 基本 特征 


教育 测验 的 对 象 是 学 生 掌 握 相关 知识 、 技 能 与 能 力 的 状况 , 研 
究 的 是 学 生 的 高 级 心理 活动 ,这 种 心理 活动 是 内 隐 的 , 它 不 能 借助 
高 精密 仪器 直接 认识 ,因此 , 它 与 人 们 经 常 接触 的 物理 测量 不 同 。 
教育 测验 主要 具有 以 下 4 个 基本 特征 。 

1. 测验 方法 与 结果 表示 的 间接 性 

教育 测验 的 间接 性 体现 在 两 个 方面 。 一 是 测验 方法 的 间接 性 。 
人 们 无 法 直接 测量 考生 的 内 在 心理 特性 ,而 只 能 通过 其 外 显 的 行 
为 ,来 间接 测量 其 心理 活动 的 特征 与 水 平 。 例 如 , 如果 想 考查 考生 
某 方面 的 数学 能 力 , 只 能 通过 考生 对 某 类 测验 题目 的 反应 和 一 些 行 
为 表现 ,借助 间接 获取 的 结果 ,运用 推理 .判断 的 方法 ,去 大 致 推断 
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考生 知识 掌握 水 平 与 能 力 高 低 。 二 是 测验 结果 表示 的 间接 性 。 测 
验 结果 表示 的 是 考生 在 测验 活动 中 的 外 在 表现 , 它 并 没有 直接 体现 
能 力 的 实质 水 平 。 由 于 人 们 使 用 数量 去 刻画 考生 外 在 表现 与 内 部 
心理 特性 与 心理 水 平 的 关系 ,而 这 种 关系 属于 不 确定 的 相关 关系 ， 
只 能 用 概率 模型 加 以 描述 ,因此 ,基于 这 种 相关 关系 所 获得 的 测验 
结果 是 否 有 效 ,准确 地 反映 出 学 生 的 能 力 状 况 , 需 要 进行 相关 的 统 
计 检 验 。 

2. 度量 单位 与 考生 位 置 的 相对 性 

由 于 人 的 外 显 行为 体现 为 连续 的 过 程 , 不 存在 绝对 的 零点 ( 即 
外 在 表现 为 0 时 ,不 存在 相应 内 在 心理 特性 全 无 的 情况 ), 因 此 教育 
测验 的 关键 在 于 将 被 试 放 在 某 一 行为 序列 上 ,找到 被 试 的 相对 位 
置 。 这 种 相对 性 体现 为 两 个 层面 ,一 是 行为 序列 的 相对 性 。 例 如 ， 
某 个 考生 的 数学 能 力 在 小 学 生 数 学 能 力 群 体 中 的 位 置 与 在 中 学 生 
数学 能 力 群体 中 的 位 置 是 截然 不 同 的 。 二 是 考生 位 置 的 相对 性 。 
考生 在 某 次 教育 测验 中 的 表现 既 有 必然 因素 又 有 偶然 因素 的 影响 ， 
不 一 定 恰好 反映 出 其 实际 能 力 , 因 此 在 某 次 教育 测验 中 位 于 某 个 
体 的 某 一 位 置 具有 相对 性 ,不 能 简单 地 断言 这 就 是 该 生 的 实际 
水 平 。 

3， 对 测验 施 测 主体 水 平 的 依赖 性 

教育 测验 的 对 象 主 要 是 学 生 的 精神 属性 , 它 需要 通过 分 析 学 
生 的 外 在 行为 .言语 活动 等 来 加 以 推论 .解释 与 揭示 ,所 采用 的 测 
验 卷 并 不 像 物理 量 (如 长 度 、 体 积 .质量 等 ) 的 测量 参照 物 ( 如 米 尺 、 
量 杯 、 天 平等 ) 那 样 界限 明确 、 状 态 固定 ,测验 卷 的 质量 依赖 于 命 制 
者 的 专业 水 平 ,而 根据 考生 的 答卷 情况 判别 考生 能 力 的 过 程 与 量 
化 结果 也 严重 依赖 于 教师 的 经 验 水 平 。 因 此 ,教育 测验 的 量化 水 
平 与 结果 运用 的 范围 都 是 有 限 的 ,不 应 过 度 追 求教 育 测验 的 准确 
生 与 代表 性 。 

4. 测验 活动 中 施 测 主 体 与 考生 的 交往 性 

教育 测验 中 ,测验 的 施 测 主体 与 考生 都 是 人 ,人 都 具有 主观 能 
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动 性 ,对 测验 目的 .测验 内 容 、 测 验方 式 与 方法 等 都 会 进行 价值 判 
断 。 因 此 ,测验 前 , 施 测 主 体 (主要 是 教师 ) 与 考生 需要 就 一 些 关 键 
性 的 问题 达成 共识 ,避免 抄袭 .不 理解 .不 配合 等 不 良 现象 的 发 生 。 


二 、 教育 测验 的 功能 


在 学 校 教育 中 ,教育 测验 是 教学 过 程 不 可 缺少 的 环节 , 它 可 以 
在 教学 的 不 同 阶段 进行 ,其 功能 主要 体现 在 教学 诊断 .教学 评价 . 促 
进 学 生 学 习 等 三 大 方面 .? 

1. 教学 诊断 方面 

根据 测验 卷 的 命 制 .测验 实施 .测验 后 的 试卷 分 析 ,教学 测验 可 
以 向 教师 提供 多 种 信息 ,作为 教师 诊断 学 生 学 习 状 况 . 了 解 学 生 的 
能 力 水 平 ` 熟 悉 测验 卷 的 命题 技巧 等 的 参考 。 

(1) 了解 学 生 知 识 储备 的 起 点 

不 同 阶段 的 教学 测验 ,功能 不 同 。 在 新 学 段 . 新 学 年 的 教学 前 ， 
实施 摸底 测验 ,目的 是 为 了 评估 学 生 已 有 的 知识 储备 .技能 掌握 水 
平 、 能 力 发 展 情况 。 根 据 摸底 测验 的 信息 反馈 ,教师 可 以 选择 适当 
的 教学 深度 与 难度 .制定 适当 的 教学 进度 ,这 样 就 可 以 有 的 放 矢 地 
开展 有 效 教学 ,因材施教 。 

(2) 检查 学 生 知识 与 技能 掌握 的 状况 

阶段 教学 完成 后 的 教学 测验 ,主要 目的 是 检查 学 生 是 否 掌握 本 
阶段 的 教学 内 容 。 对 测验 后 的 学 生 答题 情况 分 析 , 可 以 向 教师 提供 
丰富 的 学 生 学 习 状 况 信 息 , 教 师 既 可 以 较为 全 面 地 了 解 学 生 掌 握 知 
识 的 状况 与 水 平 ,又 可 以 从 中 查 清 学 生 在 认 知 结构 上 存在 的 缺陷 与 
不 足 , 从 而 为 实施 补救 教学 提供 详实 的 参考 。 

(3) 熟悉 试题 的 特征 与 功能 

教育 测验 质量 的 好 坏 很 大 程度 上 依赖 于 测验 卷 的 命 制 质量 。 




















四 余 民 宁 闭 ,教育 测验 与 评 最 一 一 成 就 测验 与 教学 评 量 (第 二 版 ) ,台北 :心理 出 版 
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测验 后 的 试卷 分 析 可 以 向 教师 提供 有 关 试 卷 与 试题 的 各 种 技术 指 
标 值 (如 :信和 度 、 效 度 、 难 度 、 区 分 度 等 ), 如 果 再 结合 教学 内 容 与 考查 
内 容 分 析 、 学 生 答卷 分 析 等 进行 研究 ,就 可 以 鉴定 试题 的 好 与 坏 , 认 
清 不 良 试题 ,并 进行 修改 或 删除 。 教 师 如 果 在 这 方面 经 常 性 地 留心 
学 习 , 就 可 以 掌握 命题 技巧 .提高 命题 水 平 。 

2. 教学 评价 方面 

教育 测验 的 结果 除了 用 来 诊断 间 题 外 ,也 广泛 地 作为 对 教师 任 
教 ,学 生 学 习 进行 问 责 的 依据 ,并 促使 教师 与 学 生 对 自己 的 职责 承 
担 起 责任 。 

《1) 鉴定 学 生 的 学 习 成 果 

教育 测验 的 基本 作用 之 一 是 对 学 生 的 学 习 成 果 进 行 等 第 评定 ， 
用 测验 成 绩 作 为 学 生 相 关 学 科学 业 成 就 的 指标 。 这 种 学 习 成 果 鉴 
定 聊 可 以 作为 学 生 在 校 学 习 效果 的 量化 指标 ,也 可 以 作为 其 他 教育 
研究 用 途 的 指标 。 

(2) 评定 教学 目标 的 达成 状况 

教学 是 教 与 学 的 共同 体 ,教育 测验 在 评定 学 生 学 习 成 果 的 同 
时 ,也 评定 了 教师 教学 的 效果 , 即 教 学 目标 的 达成 状况 。 根 据 测 验 
后 的 结果 与 分 析 , 教 师 可 以 知道 ,目前 的 教学 状况 是 否 达到 了 预 设 
的 教学 目标 ? 如 果 没 有 达到 , 则 距离 目标 还 有 多 远 ? 造 成 这 种 情况 
的 原因 是 什么 ?是 教材 问题 , 教 法 问题 ,学 法 问题 ,还 是 其 他 ?是 否 需 
要 进行 补救 教学 ”是 否 需要 再 进行 一 次 测验 重新 加 以 评定 ? 等 等 。 

(3) 制定 后 继 教 学 方案 的 参考 

教育 测验 的 结果 除了 评定 学 生 的 学 ,教师 的 教 ,还 促进 教师 认 
真 反思 自己 的 教学 得 失 , 如 教学 过 程 中 教学 内 容 的 深浅 、 难 易 、 宽 害 
等 的 把 握 是 否 恰当 ,教学 策略 与 方法 是 否 合适 ,对 学 生 学 法 的 指导 
与 督促 是 否 到 位 ,对 考试 技巧 的 关注 与 指导 是 否 适度 ,与 其 他 教师 
的 沟通 是 否 及 时 ,等 等 。 对 这 些 问 题 的 思考 为 制定 后 继 内 容 教 学 方 
案 提 供 了 重要 参考 。 

3. 促进 学 生 学 习 方 面 

教育 测验 不 仅 能 够 帮助 教师 诊断 教学 问题 ,改进 教学 活动 ,也 
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能 够 帮助 学 生 积极 开展 学 习 ,促进 个 人 成 长 。 

(1) 激发 学 生 的 学 习 动 机 

一 份 编制 良好 的 教育 测验 ,可 以 向 学 生 提供 多 方位 的 信息 ,如 
短期 学 习 目 标的 检 核 .主要 学 习 方法 与 技巧 的 引导 ,学 习 成 果 的 反 
馈 ,等 等 。 学 生 参 加 测验 后 ,能 够 明确 感受 自己 的 进步 ,清晰 看 到 自 
已 是 否 达到 学 习 目 标 ,这 样 就 可 以 激发 学 生 的 学 习 动 机 ,每 个 阶段 
都 自主 地 向 教师 制定 的 教学 目标 靠近 。 

《2) 引导 学 生 系 统 复习 与 钻研 知识 

教育 测验 的 目的 之 一 是 促进 学 生 更 好 地 开展 学 习 。 学 生 在 参 
加 测验 之 前 ,需要 对 阶段 的 学 习 内 容 进行 系统 复习 ;参加 测验 时 , 需 
要 集中 精力 对 自己 的 记忆 力 、 理 解 力 、 推 理 力 、 迁 移 力 等 进行 全 方位 
的 调动 ,尤其 在 解答 较为 复杂 、 深 奥 的 难题 时 ,需要 对 自己 的 潜能 进 
行 深层 次 开发 。 教 育 测验 是 对 教学 活动 的 有 力 补充 。 

《3) 帮助 学 生 客观 认识 自我 

教育 测验 后 ,学 生 通 过 总 结 与 反思 ,可 以 发 现 自己 学 习 方 法 ,学 
习习 惯 等 方面 的 优势 与 不 足 , 洞 悉 自 己 在 知识 学 习 方面 的 长 处 与 短 
处 、 缺 陷 与 漏洞 .困难 与 疑惑 ,明确 自己 在 概念 法则 ,命题 ,性 质 与 
定理 、 技 能 与 方法 等 方面 的 学 习 状 况 ,以 促进 自我 了 解 、 自 我 认可 ， 
在 后 续 的 学 习 中 开展 针对 性 学 习 , 形 成 最 佳 的 学 习 决 策 。 


三 、 常 模 参照 测验 与 标准 参照 测验 


测验 是 测量 的 一 种 。 凡 是 测量 都 有 参照 系 ,如 ,测量 山 的 高 度 
总 要 对 照 海 平面 ;教育 测验 的 分 数 也 必须 与 一 定 的 参照 物 或 参照 系 
进行 比较 ,其 意义 才能 说 清楚 。 按 照 解释 测验 分 数 的 参照 体系 的 不 
同 ,教育 测验 可 以 分 为 常 模 参照 测验 和 标准 参照 测验 两 种 。 

1. 常 模 参照 测验 

参照 某 个 特定 群体 分 数 的 常 模 来 解释 个 别 测验 分 数 在 团体 中 
所 处 相对 位 置 的 测验 称 为 常 模 参 照 测 验 , 常 模 参 照 测验 分 数 是 一 种 
相对 评分 分 数 , 所 测 考 生 分 数 的 意义 是 由 他 与 其 他 考生 水 平 相互 比 
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较 的 关系 来 确定 的 , 它 突 出 的 是 个 别 差 异 。 因 此 ,在 进行 分 数 解 释 
前 , 常 模 的 选择 是 关键 。 

常 模 是 解释 分 数 意义 的 参照 体系 ,是 对 个 别 测 验 分 数 做 出 相对 
意义 评定 的 实际 依据 。 教 育 测验 中 经 常 使 用 的 是 组 内 常 模 , 它 主要 
分 为 百 分 等 级 常 模 与 标准 分 数 常 模 两 类 。 

(1) 百 分 等 级 常 模 

百 分 等 级 常 模 就 是 某 个 特定 考生 群体 ( 即 常 模样 组 ) 所 测 特定 
水 平 百分制 分 数 的 水 平分 布 状态 。 在 实际 操作 时 ,人 们 只 需要 将 某 
一 考生 的 测验 分 数 与 常 模样 组 的 整个 分 布 状态 进行 对 比 ,就 可 以 确 
定 该 考生 的 水 平 在 常 模样 组 中 的 相对 位 置 ,从 而 确定 其 优 劣 。 

一 般 而 言 ,不 同 测验 上 的 原始 分 数 不 能 直接 进行 比较 ,因为 各 
个 测验 的 满分 值 、 难 度 等 不 同 。 但 如 果 不 同 测验 在 同一 个 常 模样 组 
上 建立 了 常 模 ,就 可 以 把 原始 分 数 对 应 的 百 分 等 级 值 ( 称 为 导出 分 
数 ? 找 出 来 ,通过 导出 分 数 的 比较 来 确定 原始 分 数 的 优 劣 。 

百 分 等 级 分 数 与 原始 分 数 的 基本 转换 公式 如 下 ; 

B= ER 01,2) 

其 中 ,Pr 为 百 分 等 级 分 数 ,N 为 常 模样 组 的 个 体 数 ,R 为 常 模 
样 组 中 全 体 原始 分 数 按照 由 大 到 小 的 顺序 排列 后 , 某 一 原始 分 数 所 
占 的 名 次 。 

男 外 , 百 分 等 级 仅仅 具有 顺序 性 ,不 具有 等 单位 性 (如 90 分 和 
89 分 间 的 1 分 与 59 分 和 60 分 间 的 1 分 不 等 值 ), 因 此 , 百 分 等 级 党 
模 的 取 值 只 具有 可 比 性 ,不 具有 可 加 性 。 

(2) 标准 分 数 常 模 

标准 分 数 常 模 就 是 某 个 特定 被 试 群体 ( 即 常 模样 组 ) 所 测 特定 
水 平 标准 分 数 的 水 平分 布 状态 ,其 中 标准 分 数 与 测验 分 数 的 转换 公 
式 如 下 : 
































_X—X 
A (1.3) 
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其 中 ,X 是 某 一 测验 分 数 ,XX 是 常 模样 组 的 测验 分 数 平均 数 ,S 
是 常 模样 组 的 测验 分 数 的 标准 差 ,Z 即 相 应 测验 分 数 的 标准 分 数 。 

由 于 无 论 什么 测验 ,原始 分 数 转化 为 标准 Z 分 数 后 ,其 平均 值 
均 为 0, 标准 差 均 为 1, 因 此 ,只 要 测验 都 是 向 同一 个 群体 施 测 , 这些 
测验 的 Z 分 数 就 有 相同 的 参照 点 与 单位 。 因 此 ,标准 Z 分 数 不 仅 具 
有 可比 性 ,也 具有 可 加 性 。 

实际 应 用 中 ,标准 Z 分 数 可 能 出 现 负 值 与 小 数 ,容易 引起 误解 ， 
因此 ,在 具体 使 用 时 ,往往 对 标准 Z 分 数 进行 线性 变换 ,例如 ,广东 
高 考 曾 使 用 T == 1002 十 500 来 公布 考生 的 高 考 单 科 成 绩 与 总 分 

常 模 参照 测验 的 目的 由 在 区 别 不 同 考生 间 的 不 同 成 就 水 平 ,并 
给 参加 测验 的 考生 评定 学 业 成 就 等 级 。 一 般 地 ,学 校 使 用 的 学 期 测 
验 、 模 拟 测验 .学 科 竞赛 ,以 及 多 数 与 就 业 或 升学 选拔 有 关 的 测验 
(如 联 考 ,高考 等 ) ,都 属于 常 模 参照 测验 。 

2， 标 准 参照 测验 

标准 参照 测验 是 指 参考 国家 制定 的 课程 标准 或 学 校 与 教师 在 
教学 前 制订 的 标准 来 解释 个 别 测验 分 数 是 否 达到 这 项 既定 标准 的 
一 种 测验 。 这 里 需要 明确 以 下 几 个 要 点 。? 

(1) 参照 的 标准 应 该 给 出 良好 的 界定 ,容易 量化 ; 

(2) 编制 的 测验 卷 对 参照 标准 的 各 个 项 目 具 有 良好 的 典型 性 与 

(3) 参照 标准 对 被 试 的 表现 做 出 的 是 绝对 评分 ， 

(4) 测验 结果 应 能 够 确切 地 反映 被 试 在 参照 标准 领域 中 实际 掌 
握 了 什么 ,掌握 到 什么 程度 ,还 有 什么 没有 掌握 。 

标准 参照 测验 的 目的 旨 在 了 解 学 生 已 经 学 会 了 什么 ,是 否 达 到 
某 一 阶段 学 校 或 教师 所 期 望 的 成 就 水 准 ,而 不 是 将 学 生 与 他 人 进行 









































中 球 书 青 著 , 现 代 测 量 理 论 在 考试 中 的 应 用 ,武汉 :华中 师范 大 学 出 版 社 ,2006 年 
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比较 。 通 常 ,学校 中 的 平时 小 考 ` 课 堂 测验 .单元 测验 等 ,以 及 毕业 
资格 考试 ,学 科 结业 考试 ,高 中 会 考 等 ,都 属于 标准 参照 测验 。 


第 三 节 教育 统计 简介 


统计 ,最 早出 于 拉丁 语 Statu, 原 意 是 指 各 种 现象 的 状况 或 状 
态 , 由 拉丁 语词 根 组 成 意大利 语 Stato, 是 国家 的 概念 与 有 关 各 国 结 
构 和 国情 方面 知识 的 总 称 .@ 现代 统计 包括 统计 资料 的 收集 .整理 、 
分 析 以 及 据 此 进行 有 关 判 断 与 决策 的 全 过 程 。 


一 、 教 育 统计 的 含义 


教育 统计 是 统计 的 一 个 分 支 ,是 把 数理 统计 的 理论 与 方法 应 用 
到 教育 领域 ,侧重 于 从 数量 角度 研究 教育 现象 .教育 规律 的 一 门 应 
用 统计 学 .2 教育 统计 的 主要 任务 是 研究 如 何 收集 、 整 理由 教育 济 
验 与 教育 调查 所 获得 的 大 量 数据 资料 ,运用 多 种 统计 方法 进行 分 析 
与 推断 ,为 做 出 正确 的 价值 判断 提供 依据 。 

在 教育 领域 中 ,人 们 借助 统计 方法 对 数据 加 以 组 织 与 概括 ,以 
揭示 数据 之 间 隐 含 的 规律 ;通过 统计 分 析 , 刻 画 教育 现象 间 的 相互 
关系 ;借助 对 样本 的 研究 ,对 相应 总 体 进行 统计 推断 ;研究 教育 现象 
中 的 各 种 差异 ,对 差异 进行 显著 性 检验 ,探索 差异 的 有 效 性 ,并 力求 
正确 反映 差异 间 的 关系 ;对 教育 现象 之 间 的 联系 与 变化 进行 深入 分 
析 , 试 图 判别 影响 教育 现象 变化 的 因素 ,等 等 。 统计 方法 的 使 用 极 
大 地 提高 了 教育 研究 的 科学 性 与 规范 性 。 


二 、 教育 统计 的 内 容 
从 应 | 的 角度 来 分 ,教育 统计 主要 包括 描述 统计 .推断 统计 两 






















































































中” 中国 社会 经 济 统计 百科 全 书 ,湖北 教育 出 版 社 ,1994 年 版 ,32 页 。 
日。 王 景 英 主 编 ,教育 统计 学 (第 2 版 ) ,北京 :高 等 教育 出 版 社 ,2006 年 10 月 ,3 页 。 
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方面 的 内 容 。 

1. 描述 统计 

描述 统计 主要 是 对 已 经 获得 的 数据 进行 整理 .归纳 .概括 ,使 得 
数据 的 数量 分 布 特征 或 变化 趋势 得 以 清晰 、 明 确 显现 。 

描述 统计 的 作用 就 是 提供 描述 、 概 括 数据 的 具体 方法 , 它 包 括 
两 个 方面 。 一 是 绘制 统计 图 表 , 如 :频数 分 布 表 .频数 分 布 直方 图 、 
折线 图 、. 茎 叶 图 等 ,以 直观 形象 的 方式 反映 出 统计 数据 的 分 布 特征 
二 是 计算 统计 量 数 , 如 集中 量 数 ( 平 均 数 、 中 位 数 、 众 数 等 )、 差 异 量 
数 (标准 差 . 极 差 、 方 差 等 )、 相 关系 数 、 对 比率 等 ,以 简约 .概括 的 数 
学 语言 反映 数据 的 特定 特征 。 

描述 统计 使 得 人 们 可 以 采用 一 组 公认 的 、 标 准 的 描述 数据 , 客 
观 地 反映 出 数据 的 特征 ,并 消除 数据 解释 过 程 中 的 主观 偏见 , 它 是 
一 种 让 人 读 懂 数 据 的 工具 。 

2， 推 断 统计 

推断 统计 的 基础 是 慨 率 论 , 它 是 在 一 定 概率 意义 下 ,通过 已 知 
部 分 的 数量 特征 信息 ,对 未 知 总 体 的 数量 特征 与 数量 关系 进行 推测 
与 估计 的 统计 分 析 方法 。 当 人 们 完成 对 一 组 数据 的 推断 后 ,应 以 概 
率 而 非 绝 对 真理 的 方式 陈述 结论 ,如 “有 90% 的 把 握 认 为 学 生 的 入 
学 成 绩 与 高 考 成 绩 呈 正 相关 ”。 

统计 推断 的 内 容 包 括 两 个 部 分 。 一 是 总 体 参数 估计 , 即 采 用 
“点 估计 ”或 “区 间 估 计 ” 的 方法 ,用 样本 的 数字 特征 对 总 体 的 数字 特 
征 进行 估计 。 二 是 假设 检验 , 即 首先 对 总 体 的 数字 参数 或 分 布 状态 
提出 一 个 假定 性 判断 ,在 这 一 前 提 下 ,根据 样本 提供 的 信息 ,采用 
“参数 检验 ”“ 非 参数 检验 ”的 方法 ,在 一 定 概率 意义 下 ,对 假设 前 提 
做 出 接受 或 拒绝 的 决策 。 

推断 统计 在 已 知 与 未 知 间 、 有 限 与 无 限 之 间架 起 一 座 桥梁 ,使 
得 入 们 研究 问题 的 思路 方法 和 研究 领域 等 都 得 到 了 极 大 的 拓 广 。 


三 、 教育 测验 与 教育 统计 的 关系 
教育 测验 与 教育 统计 都 借助 数学 方法 开展 研究 。 教 育 测验 是 
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依据 一 定 的 法 则 ,用 数字 对 教育 过 程 或 教育 效果 加 以 确定 的 过 程 。 
由 于 教育 测验 对 象 不 是 实体 存在 的 ,是 人 类 的 心理 特质 ,因此 ,教育 
验 具 有 测验 方法 和 结果 表示 的 间接 性 、 度 量 单位 与 被 试 位 置 的 相 
对 性 、 对 测验 施 测 主体 水 平 的 依赖 性 、 测 验 活 动 中 施 测 主体 与 被 试 
的 交往 性 。 教 育 统计 同样 以 数据 作为 研究 对 象 ,以 数学 方法 作为 研 
究 手 段 , 对 教育 教学 现象 进行 分 析 , 力 图 揭示 其 中 隐 含 的 教育 规律 。 
教育 测验 与 教育 统计 是 了 解 教学 状况 .开展 教学 活动 .进行 教 
学 评估 的 有 效 工具 ,二 者 总 是 共同 使 用 、 共 同 发 挥 作用 。 其 中 ,测验 
与 测量 是 统计 的 前 提 , 有 了 测验 与 测量 的 数据 ,统计 才 可 以 进行 ; 反 
过 来 ,统计 又 是 测验 与 测量 的 基础 ,不 借助 统计 方法 ,测验 与 测量 的 
数据 无 法 进行 整理 .概括 与 分 析 。 
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“ 试卷 质量 的 基本 分 析 


在 学 校 教 学 工作 中 ,教师 必须 运用 教育 测量 理论 设计 各 种 测 
验 , 对 教 与 学 的 情况 做 出 评估 与 决策 。 评 估 与 决策 包括 两 个 方面 ， 
一 方面 ,通过 测验 ,教师 可 以 了 解 学 生 的 学 习 情况 ,并 借 此 了 解 教学 
效果 ,改进 教学 方法 ,提高 教学 质量 ; 另 一 方面 ,学 生 可 以 通过 测验 ， 
了 解 自 己 对 学 习 内 容 的 掌握 情况 ,有 针对 性 地 总 结 学 习 方 法 ,提高 
学 习 效 益 。 

试卷 是 测验 运行 的 实际 载体 ,试卷 命题 质量 的 优 劣 ,直接 关系 
到 根据 测验 进行 评估 的 有 效 性 与 决策 的 正确 性 ,对 试卷 进行 科学 、 
客观 的 评价 分 析 , 对 优化 学 与 教 的 内 容 、 改 革 学 与 教 的 方式 ,把握 学 
与 教 的 重点 、 提 高 学 与 教 的 质量 ,以 及 加 大 对 学 校 测验 的 管理 力度 ， 
均 具 有 重要 意义 。 

一 般 地 ,对 试卷 命 制 质量 的 分 析 , 往 往 放 在 学 校 教学 测验 结束 
后 进行 ,通常 从 定性 .定量 两 方面 开展 。 定 性 分 析 时 ,主要 考虑 : 试 
题 测 查 的 内 容 要 求实 际 上 能 否 达到 原 定 目标 ;试题 类 型 编制 原则 运 
用 得 如 何 , 实 际 编 拟 技能 发 挥 得 如 何 ,包括 情境 设置 .问题 提出 、 作 
答 指导 、 词 语 表达 和 图 形 符号 等 方面 ;试题 间 关 系 的 处 理 是 否 适当 ， 
评分 标准 是 否 正确 科学、 合理 .明晰 ,等 等 。 定 量 分 析 主 要 是 计算 
试卷 与 试题 技术 质量 的 指标 或 参数 ,包括 难度 .区 分 度 、 猜 测 概率 、 
选择 题 干 扰 项 效率 等 。 

根据 经 典 真 分 数理 论 , 分 析 一 份 测验 试卷 的 质量 , 既 需 要 考虑 
测验 结果 的 稳定 性 与 一 致 性 , 即 测量 结果 是 否 真实 .客观 地 反映 考 
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生 的 实际 水 平 ; 又 要 注重 测验 结果 是 否 准确 有 效 , 即 测量 结果 是 否 
能 够 反映 预期 的 测验 目的 ;还 要 兼顾 试题 的 难 易 程度 与 考生 知识 与 
能 力 水 平 是 否 相 匹配 ,是 否 能 够 将 学 习 能 力 不 同 的 考生 区 分 开 来 。 
这 涉及 四 个 基本 质量 指标 :信和 度 、 效 度 ,难度 和 区 分 度 。 其 中 ,信和 度 
与 效 度 主 要 针对 整 份 测验 卷 而 言 ,难度 与 区 分 度 主要 针对 测验 
试题 。 























第 一 节 测验 信和 度 


对 整 份 测验 试卷 而 言 , 测 量 的 结果 是 否 真实 .客观 地 反映 了 考 
生 的 实际 水 平 , 即 测验 可 信 与 否 ,在 多 大 程度 上 可 信 , 是 首先 需要 考 
虑 的 问题 ,这 就 是 测验 信和 度 。 


一 、 信 度 概念 


测验 信 度 指 的 是 测量 结果 的 稳定 性 或 可 靠 的 程度 , 即 测验 得 到 
的 结果 (实测 分 数 ) 与 考生 实际 水 平 ( 真 分 数 ) 间 的 一 致 性 程度 。 由 
于 种 种 原因 ,实测 分 数 一 般 并 不 等 于 考生 能 力 的 真 分 数 ,两 者 之 间 
的 差异 值 称 为 测量 误差 。 显 然 ,测量 误差 越 小 ,测验 信 度 就 越 高 。 

根据 经 典 真 分 数理 论 ,测验 信和 度 可 以 从 真 分 数 模型 、 依 据 平行 
测验 构造 的 真 分 数 等 值 模型 等 角度 理解 。 

1.， 信和 度 指数 

根据 真 分 数理 论 模 型 x = 1 十 e, 实测 分 数 z 不 仅 受 真 分 数 : 的 
影响 ,还 受 误差 分 数 。 的 影响 。 由 于 真 分 数 1 与 误差 分 数 e 彼此 独 
立 , 实 测 分 数 x 与 真 分 数 : 的 相关 性 也 决定 着 误差 分 数 的 大 小 。 如 
果 p(z, 4) 二 1, 则 表明 误差 完全 被 控制 ,实测 分 数 z 能 够 毫 无 偏差 
地 传达 真 分 数 : 的 信息 ;如 果 p(x, 1) = 0， 则 表明 实测 分 数 z 与 真 
分 数 : 毫 不 相干 ,实测 分 数 的 差异 反映 的 全 部 是 随机 误差 的 影响 ,说 
明 测验 结果 毫 无 意义 。 因 此 ,pCz， 四 可 以 反映 对 测验 误差 控制 能 力 
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的 大 小 , 它 被 称 为 信 度 指数 。 依 据 真 分 数理 论 假 设 可 以 推导 出 


oz 日 一 开 。 (2.1) 


Or 


其 中 ,ga, 是 真 分 数 的 标准 差 ,o, 是 实测 分 数 的 标准 差 。 

由 于 理论 上 真 分 数 不 可 直接 测量 ,公式 2. 1 无 法 用 于 实际 计 
算 , 只 有 理论 分 析 的 价值 。 

2. 信和 度 系 数 

根据 真 分 数理 论 ,一 组 平行 测验 测量 的 是 同一 个 考生 总 体 的 真 
分 数 , 若 测验 控制 误差 的 能 力 强 , 则 无 论 用 平行 测验 中 哪 一 个 测验 
上 的 实测 分 数 去 估计 真 分 数 都 不 会 有 过 大 偏离 ,所 以 用 一 个 平行 测 
验 zx 上 的 实测 分 数 去 估计 另 一 个 测验 zs 的 实测 分 数 也 应 该 很 准 
确 。 也 就 是 说 , 当 测 验 误差 控制 能 力 强 时 ,两 平行 测验 上 实测 分 数 
的 相关 性 就 高 。 由 于 一 组 平行 测验 中 任意 两 个 测验 的 相关 系数 都 
等 于 其 他 任何 两 测验 的 相关 系数 ,因此 ,我 们 称 平行 测验 上 两 组 测 
验 实测 分 数 间 的 相关 系数 p(x ， zs) = mn 为 测验 的 信 度 系数 。 容 
易 推导 得 出 : 



































2 
产品 一 PCziy，2) 写 = [p(x, 2)J。 240) 


其 中 ,of 是 真 分 数 的 方差 ,o: 是 实测 分 数 的 方差 ,p(x, 是 测验 
的 信 度 指数 。 

公式 2. 2 中 ,虽然 真 分 数 的 方差 无 法 计算 ,但 是 两 个 平行 测验 
的 实测 分 数 却 是 可 以 得 到 的 ,这 样 就 给 解决 信 度 计算 问题 开辟 了 实 
际 操作 的 途径 。 

在 数学 测验 研究 中 ,我们 往往 只 探讨 信 度 系数 的 计算 问题 。 本 
书 以 下 没有 特别 说 明 时 , 信 度 都 是 指 信 度 系数 。 


二 、 测 验 信和 度 的 估算 方法 
理论 上 ,我 们 可 以 编制 出 两 份 平行 测验 卷 ,然后 让 同一 批 考生 
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使 用 这 两 份 测验 卷 , 再 根据 得 到 的 两 组 实测 分 数 计算 两 份 测验 卷 的 
相关 系数 ,从 而 估计 测验 信和 度 。 然 而 ,实际 工作 中 ,一 方面 ,教师 和 
学 
操 


























生 没有 那么 多 的 精力 和 时 间 参 加 重复 的 测验 ; 另 一 方面 ,在 实际 
E 时 ,也 很 难 编制 出 严格 意义 上 的 平行 测验 卷 ,很 难保 证 两 份 试 
卷 测量 的 是 同一 种 数学 能 力 ,测验 的 题 型 .方式 完全 相同 ,内 容 覆 盖 
完全 相同 ,难度 完全 等 值 。 

在 具体 应 用 中 ,人 们 对 估算 方法 进行 了 改进 ,希望 根据 一 次 测 
验 来 估计 测验 信 度 ,通过 这 种 方法 估算 得 到 的 测验 信 度 都 称 为 测验 . 
信 度 的 内 部 一 致 性 系数 。 估 算 测验 信 度 内 部 一 致 性 系数 的 方法 主 
要 有 两 种 。 

1. 分 半 法 

顾名思义 ,分 半 法 就 是 将 测验 施 测 于 一 组 考生 ,然后 将 测验 人 
为 地 分 成 两 个 平行 部 分 ,通过 比较 这 组 考生 在 这 两 个 部 分 实测 分 数 
间 的 相关 性 ,来 估计 测验 信和 度 ,这样 得 到 的 测验 信和 度 也 叫做 分 半 
信和 度 。 

分 半 法 的 核心 在 于 如 何 将 测验 卷 分 半 。 适 合 数 学 测验 使 用 的 
分 半 方 法 有 两 种 。 第 一 种 是 奇偶 题目 分 半 , 即 将 奇数 题 (第 1、3、… 
题 ) 组 成 一 个 部 分 ,偶数 题 (第 2、4、… 题 ) 组 成 剩余 部 分 ;这 种 分 半 
法 可 以 保证 两 个 分 测验 卷 都 包容 了 原 测验 的 开头 .中 间 、 结 尾 的 同 
等 数量 的 题目 ,因而 平衡 了 很 多 干扰 效应 。 第 二 种 是 将 测验 卷 分 成 
若干 个 内 容 块 ,再 将 各 内 容 块 的 题目 奇偶 分 半 , 所 有 的 奇数 题 和 所 
有 的 偶数 题 各 组 成 一 个 分 测验 。 具 体 命题 时 ,可 以 考虑 把 两 种 方法 
结合 起 来 组 构 测验 卷 。 

根据 分 半 法 得 到 分 测验 zi 与 分 测验 zx; ,计算 得 到 的 相关 系数 
7 只 能 代表 半 个 测验 的 信 度 , 它 并 不 是 整个 测验 的 信和 度 , 需 要 进行 
矫正 ,矫正 公式 如 下 : 












































2r, 


i 


其 中 ,rs 为 整 份 测验 卷 的 信和 度 ,x,,,, 为 两 个 分 测验 卷 间 的 相关 


(2: 3) 


rz 
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分 半 信 度 的 误差 主要 来 源 于 测验 的 分 半 过 程 。 用 不 同方 式 对 
测验 进行 分 半 , 所 得 的 分 半 信 度 值 也 会 不 同 。 

2、 同 质 性 法 

同 质 性 法 是 分 半 法 的 拓展 ,分 半 法 是 将 一 份 测验 卷 分 成 两 半 进 
行 估算 , 同 质 性 法 是 将 一 份 测验 卷 分 成 个 平行 的 部 分 , 求 这 nn 个 平 
行 的 部 分 间 的 一 致 性 程度 。 计 算 公 式 为 























es 到 

其 中 ,rz 为 整 份 测验 卷 的 信 度 ,r- ,为 n 个 平行 部 分 任意 两 个 
间 的 相关 系数 。 

当 n 二 2 时 , 即 为 公式 2.3。 

当 把 测验 卷 中 的 每 道 试题 看 成 彼此 平行 时 ,公式 2.4 可 以 变 
形 为 


Tyr 








Dj pg, 
ra 一 一 (= 等 (2,5) 


这 里 ,n 是 测验 卷 中 的 试题 总 数 ,p; 与 q; 分 别 是 第 i 道 试题 上 的 
答对 率 与 答 错 率 (q; = 1 一 p;),o? 是 测验 总 分 的 方差 ,这 就 是 有 名 的 
库 德 一 理 查 森 公 式 (KR - 20) 。 该 公式 仅仅 适用 于 估算 由 “对 、 错 ?分 
为 两 级 评分 的 选择 题 组 成 测验 卷 的 信 度 。 

当 测 验 卷 的 题 型 有 填空 题 .选择 题 .解答 题 等 多 种 形式 ,每 道 试 
题 的 满分 也 不 一 定 相同 时 ,公式 2. 4 可 以 变形 为 


C2 
一 rm 一 一 (= 等 (2. 6) 


这 里 ,n 是 测验 的 试题 总 数 ,a 是 每 道 试题 上 实测 分 数 的 方差 ， 
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5 是 测验 总 分 的 方差 ,这 便 是 有 名 的 科隆 巴赫 a 系数 公式 。 
需要 注意 的 是 ,测验 信 度 不 仅 与 测验 试题 总 数 相关 ,而 且 与 考生 
群体 的 大 小 也 有 很 大 的 关系 ,计算 时 ,需要 特别 交代 信 度 计算 的 背景 。 


三 、 影 响 测验 信和 度 的 因素 


根据 经 典 真 分 数理 论 , 测 验 信 度 主要 反映 的 是 测验 中 控制 误差 
能 力 的 强 弱 ,如 果 明 确 了 误差 来 源 ,就 能 够 有 目的 地 加 强 对 误差 的 
控制 ,从 而 提高 测验 信 度 。 因此 ,有 必要 对 测验 误差 的 来 源 进行 探 
讨 ,下 面 分 别 从 测验 卷 与 测试 题 , 考 生 因 素 、 施 测 环境 ,评分 标准 与 
评分 过 程 等 四 个 方面 进行 分 析 。 

1. 测验 卷 与 测试 题 

测验 卷 与 测试 题 本 身 的 一 些 因素 会 直接 产生 测量 误差 。 例如 ， 
数学 测验 卷 中 都 包括 客观 题 与 主观 题 两 大 类 ,其 中 客观 题 中 采用 选 
样题 ,判断 题 \ 填 空 题 等 多 种 形式 ,这 些 题 型 由 于 直接 根据 结论 的 对 
错 判断 考生 对 相应 知识 点 的 掌握 情况 ,缺少 对 考生 思维 过 程 的 分 
析 , 考 生 在 作答 时 答案 的 获得 又 具有 一 定 的 猜测 性 ,这 就 能 导致 
实测 分 数 与 考生 真实 能 力 之 间 不 一 致 ,从 而 影响 测验 信 度 。 

又 如 ,测验 卷 中 试题 难度 直接 影响 考生 成 绩 。 如 果 试 题 难度 过 
大 ,考生 凭借 掌握 的 知识 不 能 顺利 解决 ,那么 考生 就 会 通过 猜测 来 
给 出 解答 以 获取 一 定 的 分 数 ,这 时 实测 分 数 更 多 反映 的 是 测验 误 
差 ,测验 信 度 很 低 。 反 过 来 , 若 试题 越 容 易 , 考 生得 分 就 越 高 ,就 越 
不 能 看 出 考生 实际 学 习 能 力 的 差异 ,因此 测验 信 度 也 就 越 低 。 

另外 ,试题 的 取样 是 否 具有 代表 性 、 测 验 卷 规定 的 作答 时 限 是 
否 足够 测验 卷 的 试题 总 数 多 少 、 测 验 卷 中 试题 知识 点 分 布 状况 、 测 
验 着 考查 能 力 的 针对 性 等 因素 都 会 影响 考生 真实 水 平 的 发 挥 。 

2. 考生 因素 

考生 状态 是 影响 测验 信 度 中 最 难 控制 的 因素 。 首先 ,考生 的 应 
试 技巧 与 稳定 的 反应 倾向 直接 影响 考生 真实 水 平 的 发 挥 。 应 试 技 
巧 在 某 种 程度 上 可 以 有 效 弥 补 知识 与 技能 方面 的 不 足 。 其 次 ,考生 
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的 应 试 动机 情绪 的 紧张 焦虑 状态 也 会 影响 其 作答 结果 。 应 试 动机 
会 影响 到 考生 的 作答 速度 、 注 意 力 、 耐 久 性 、 反 应 速度 等 ,适度 的 焦 
虑 水 平 将 提高 考生 的 兴奋 性 ,增强 其 注意 力 ;而 测验 的 时 间 限 制 、 难 
度 水 平等 决定 着 考生 的 焦虑 水 平 ,因此 ,种 种 因素 都 可 能 对 测验 结 
果 产 生 积极 或 消极 影响 。 另 外 ,考生 对 数学 测验 任务 的 理解 .在 所 
测 知识 技能 上 的 熟练 水 平 .在 记忆 与 注意 力 上 的 波动 等 都 可 能 对 考 
生 的 测验 操作 水 平 产生 不 稳定 的 影响 。 最 后 ,考生 的 健康 状况 , 疲 
劳 与 否 等 因素 也 会 影响 其 真实 水 平 的 发 挥 。 

3. 施 测 环境 

施 测 环境 包括 物理 环境 、 非 物理 的 外 界 环境 两 类 。 物 理 环境 包 
括 : 施 测 教 室 的 光线 .噪音 .通风 .温度 等 ,这 些 都 可 能 对 考生 的 情 
绪 、 应 试 状态 以 至 真实 水 平 的 发 挥 产生 正面 或 负面 的 影响 。 非 物理 
的 外 界 环境 包括 :有 人 作 浆 .试卷 发 错 、 临 时 发 现 试卷 印刷 不 清 等 种 
种 意外 的 干扰 与 突变 ,导致 考生 分 心 , 影 响 考 生 作答 。 

4. 评分 标准 与 评分 过 程 

由 于 数学 主观 题 的 解答 方法 往往 不 止 一 种 ,如 何 使 得 不 同 解法 
之 间 的 评分 标准 保持 等 价 , 如 何 确定 不 同步 又 之 间 的 赋 分 ,都 具有 
很 强 的 经 验 性 。 其 次 ,不 同 教师 对 主观 题 的 同一 个 评分 标准 的 理解 
也 会 有 差异 ,在 评判 考生 的 具体 作答 时 也 会 有 差异 。 另 外 ,同一 个 
教师 因为 心境 ,疲劳 等 因素 的 影响 , 评 卷 过 程 的 前 后 标准 也 会 有 差 
异 ,这 些 都 可 能 导致 评分 误差 的 产生 。 

由 上 述 分 析 可 知 , 改 进 测 验 信 和 度 指标 可 以 从 以 下 几 方 面 进行 : 
适当 增加 试题 总 数 、 保 证 一 定 的 试题 难度 ,减少 试题 的 猜测 度 .制定 
合理 的 评分 标准 、 保 证 试题 考查 内 容 的 针对 性 、 控 制 外 在 环境 减少 
无 关 干 扰 等 。 


、 测 验 信 度 的 定性 评价 指标 


对 一 份 测验 卷 的 信 度 评价 ,除了 计算 一 个 具体 数值 并 交代 该 数 
值 反映 的 实际 意义 外 ,从 定性 的 角度 展开 分 析 更 有 助 于 测验 卷 命 制 
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质量 的 改进 。 一 般 地 ,在 施 测 外 在 环境 已 经 确定 的 情况 下 ,定性 评 
价 测验 信 度 主要 围绕 测验 卷 ,测验 作答 过 程 与 测验 评分 过 程 进 行 ， 
因此 常见 的 评价 指标 有 如 下 四 个 。 

1. 试题 考查 目标 的 一 致 性 程度 

学 校 教学 过 程 中 的 测验 目的 很 明确 , 即 为 教 与 学 服务 。 如 果 测 
验 卷 中 的 试题 围绕 着 某 阶段 的 教学 内 容 命 制 , 且 试 题 的 背景 为 学 生 
所 熟悉 ,不 存在 理解 障碍 ,试题 涉及 的 知识 技能 针对 性 强 ,知识 技能 
跨越 度 合适 ,不 存在 大 面积 遗忘 现象 ,那么 实测 分 数 就 能 够 较 好 地 
反映 出 考生 阶段 性 知识 技能 的 掌握 情况 ,测验 比较 可 信 。 

2. 试题 呈现 的 规范 性 

在 数学 测验 卷 中 ,试题 呈现 的 规范 性 包括 以 下 四 个 方面 :文字 
表述 准确 ,不 会 导致 理解 歧义 ;数学 符号 呈现 规范 ,使 用 合理 ;几何 
图 形 、 统 计 图 表 等 呈现 规范 ,标注 准确 ,线条 美观 大 方 ; 不 存在 试题 跨 
页 现象 ,不 会 导致 考生 无 意 错漏 等 。 当 测验 满足 了 试题 呈现 规范 性 要 
求 后 ,就 可 以 尽量 减少 试题 因素 造成 的 测验 误差 ,提高 测验 信和 度 。 

3， 试题 作答 的 猜测 度 

由 于 试题 猜测 度 过 高 会 影响 对 考生 真实 水 平 的 判断 ,因此 减 小 
试题 正确 作答 的 猜测 度 ,就 可 以 提高 测验 信和 度 。 在 分 析 选 择 题 , 填 
空 题 的 作答 时 ,应 研究 正确 作答 的 猜测 度 的 大 小 ,尽量 减 小 正确 作 
答 的 猜测 度 。 

4. 评分 标准 的 合理 性 

教学 过 程 中 用 于 检查 教学 效果 的 测验 大 部 分 由 教师 决定 评分 
标准 ,而 评分 标准 是 否 合理 直接 关系 到 实测 分 数 与 考生 真实 水 平 之 
间 的 一 致 性 。 在 具体 研究 评分 标准 时 ,主要 看 同一 试题 不 同 解法 评 
分 标准 的 等 价 性 、 同 一 试题 解答 分 步 赋 分 的 合理 性 、 试 题 难度 与 分 
值 多 少 的 匹配 性 等 因素 。 

根据 上 述 分 析 , 在 评价 测验 信和 度 时 ,可 以 先 由 各 个 评 卷 教师 填 
写 表 2 - 1, 然 后 再 将 评 卷 教师 的 意见 汇总 形成 一 份 测验 卷 的 总 评价 
表 。 填 表 时 ,其 中 正面 典型 .负面 典型 主要 举 出 各 个 指标 中 做 得 好 
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或 不 好 的 案例 ,并 简要 说 明 好 或 不 好 的 原因 ,以 便 以 后 改进 。 
表 2-1 测验 信和 度 定性 评价 表 


评定 等 级 
评价 指标 评价 要 点 这 ET 正面 典型 | 负面 典型 


| 
0) 卷 中 试题 围绕 着 考查 目标 | | 
合 制 


(2) 试题 的 背景 为 学 生 所 熟 
1. 试题 考 悉 , 不 存在 理解 障碍 
查 目标 全 一 一 一 一 一 一 一 一 | 
的 一 致 | (3) 试题 涉及 的 知识 技能 针对 
性 程度 | 。 性 强 


(4) 知识 技能 跨越 度 合适 , 考 
生 不 存在 大 面积 遗忘 
| i (Es 

(1) 文字 表述 准确 ,不 会 导致 


理解 歧义 
| 


(2) 数学 符号 呈现 规范 ,使 用 


2. 试题 呈 | 合理 


现 的 规 | (3) 几何 图 形 、 统 计 图 表 等 呈 



























































范 性 现 规范 , 标注 准确 , 线条 
美观 大 方 
人 
(4) 不 存在 试题 跨 页 现象 ,不 
会 导致 考生 无 意 错漏 
3 试题 作 | (1) 选择 题 选 择 支 的 迷惑 性 好 
答 的 狂 
测度 (2) 主观 题 的 难 易 程度 合理 性 
(1) 同一 试题 不 同 解法 评分 标 
准 的 等 价 性 
4 加 分 标 | (2) 后 一 试题 分 沙 解 答 赋 分 的 
se ee 
理性 
(3) 试题 难度 与 分 值 多 少 的 匹 
村 | es er ak | 
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五 、 测验 信和 度 的 定量 评价 标准 


测验 信 度 值 要 达到 多 高 才 好 ? 这 取决 于 测验 的 使 用 目的 与 测 
验 的 类 型 。 在 教育 测验 中 ,一 般 以 科隆 巴赫 信 度 系数 作为 测验 信 
度 的 下 限 , 来 评价 测验 质量 。 根 据 纳 讷 莱 (1967) 的 研究 ,a 信 度 系数 
的 不 同 范围 ,反映 测验 的 不 同 问题 ,如 表 2 - 2。 




















表 2-2 科隆 巴赫 a 信 度 系数 评价 标准 





a 值 


评 价 





COP 


信 度 很 好 ,达到 最 好 的 标准 化 考试 水 平 。 





[0.8, 0.9) 


对 学 校 考试 而 言 ,非常 好 。 





[0.7, 0.8) 


对 学 校 测试 而 言 , 大 部 分 试题 很 好 ,可 能 少数 试题 需要 改进 。 





[0.6, 0.7) 


信 度 稍 低 , 需 要 补充 其 他 测验 以 确定 分 数 或 等 次 。 部 分 试题 需 
要 改进 。 





[0.5, 0.6) 


信 度 低 。 建 议 对 试卷 进行 修改 (如 果 试 题 数 多 于 10 道 )。 需 要 
补充 其 他 考试 来 可 靠 地 确定 分 数 或 等 次 。 





(0, 0.5) 





信和 度 差 。 考 试 基本 无 效 ,需要 修改 。 


而 ,结合 教学 过 程 进行 的 常规 数学 章节 测验 、 单 元 测验 与 学 
ep 突出 的 是 教学 目标 与 课程 标准 
要 求 ,目的 是 为 了 告诉 考生 应 该 学 习 什 么 .已 经 掌握 了 什么 ,掌握 到 
什么 程度 、 到 底 还 存在 什么 差距 ,关注 的 是 教学 目标 的 全 面 达成 与 
实现 。 在 平时 的 小 测验 中 题目 的 同 质 性 要 求 并 不 是 主要 关注 的 , 因 
此 ,可 能 出 现 测验 信 度 的 内 部 一 致 性 系数 较 低 , 但 测验 结果 的 可 靠 
性 不 低 的 情况 。 


需要 注意 的 是 ,在 估计 一 份 测验 卷 的 测验 信和 度 时 , 考 和 




















E 总 体 异 





质 性 高 , 即 所 测 真实 能 力 差 异 大 , 则 实测 分 数 分 布 范围 就 广 ,测验 信 
度 值 相应 就 高 。 反 之 , 若 考 生 总 体 同 质 性 高 ,那么 实测 分 数 彼此 很 





加。 雷 新 勇 ,考试 数据 的 统计 分 析 和 解释 ,上 海 :华东 师范 大 学 出 版 社 ,2007,246 页 。 
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接近 ,分 数 分 布 就 很 狭小 ,对 应 的 测验 信 度 值 就 偏 小 。 


第 二 节 测验 效 度 


测验 信和 度 高 低 代表 的 是 测验 分 数 的 稳定 性 , 它 是 评估 测验 质量 
的 一 个 重要 指标 。 但 是 ,测验 信 度 高 不 一 定 就 可 以 断言 这 是 一 个 好 
测验 。 例 如 ,用 直 尺 多 次 度量 某 个 物体 的 长 度 , 所 得 结果 的 误差 非 
常 小 ,但 是 如 果 该 直 尺 的 刻度 本 身 有 错误 ,那么 所 度量 到 的 物体 的 
长 度 总 是 以 一 定 的 规律 偏离 物体 的 真正 长 度 ,那么 这 种 度量 显然 是 
无 效 的 。 又 如 ,如 果 用 直 尺 去 衡量 物体 的 重量 ,那么 显然 无 法 达到 
度量 目的 。 因 此 ,评估 测验 质量 时 ,还 需要 使 用 另 一 个 更 为 重要 的 
指标 :测验 效 度 。 


一 、 效 度 概 念 


效 度 ,就 是 测验 测 到 计划 要 测 的 东西 的 程度 。 例 如 ,如 果 一 个 

测验 是 去 评估 考生 数学 推理 能 力 的 ,那么 需要 确定 的 是 考生 在 测验 
过 程 中 应 该 是 对 给 定 的 材料 进行 推理 ,而 不 是 在 生 搬 硬 套 公式 。 如 
果 测 验 结果 完全 反映 出 编制 测验 时 希望 测 到 的 数学 推理 能 力 ,那么 
测验 效 度 就 很 高 ;如 果实 际 上 只 测 出 了 一 部 分 数学 推理 能 力 ,其 余 
测 出 的 是 考生 的 记忆 力 ,那么 测验 效 度 就 不 够 高 。 因 此 , 效 度 是 测 
验 中 最 重要 的 质量 指标 。 
由 于 测验 要 测 的 对 象 是 考生 的 心理 特质 (知识 与 技能 掌握 情 
况 , 空 间 想象 能 力 .推理 能 力 等 ), 所 编制 的 测验 是 否 真正 测 查 到 它 ， 
即 测验 是 否 有 效 , 有 效 的 程度 如 何 , 并 不 能 由 人 们 的 主观 愿望 、 看 
法 、 经 验 等 简单 决定 , 布 只 能 依靠 客观 事实 和 实际 证 据 进行 验证 。 
验证 测验 效 度 时 需要 明确 以 下 几 个 问题 。 

1. 测验 是 否 正 确 有 效 , 首 先 取决 于 测验 目标 

任何 测验 都 是 为 测验 目的 与 功能 服务 的 。 为 了 支持 测验 目的 ， 
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在 命 制 测验 卷 时 需要 根据 测验 目的 界定 应 予 评 鉴 的 知识 .技能 、 能 
力 .过 程 与 特征 ,并 说 明 它 与 其 他 测验 目的 的 异同 。 例 如 , 某 个 阶段 
单元 测验 目的 是 为 了 检验 学 生 是 否 做 好 学 习 下 一 阶段 知识 的 准备 ， 
那么 命 制 测验 卷 时 需要 考虑 :(1) 学 习 下 一 阶段 知识 必 备 的 技能 是 
什么 ? (2) 与 这 些 必 备 技能 相对 应 的 测验 内 容 领 域 是 什么 ?(3) 如 
何 选择 测验 试题 才能 代表 测验 内 容 领 域 ? 4) 测验 分 数 是 否 会 受 无 





关 变 量 的 过 多 影响 ? (5) 测 验 得 分 高 的 考生 是 否 在 下 一 阶段 学 习 中 
能 够 比 测验 得 分 低 的 考生 学 得 更 好 ? 等 等 。 同 样 地 ,获取 实测 分 数 
后 ,也 要 从 这 些 方面 去 验证 测验 目标 实现 了 多 少 , 进 而 去 判断 测验 


效 度 的 高 低 。 
于 不 同 测验 服务 于 不 同 的 测验 目的 ,因此 ， 
言 效 度 很 高 的 测验 ,对 于 其 他 目的 而 言 ,测验 效 度 1 


























对 于 某 一 目的 而 
可 能 很 低 ,这 一 点 


2. 测验 是 否 有 效 , 关 键 取决 于 如 何 使 用 测验 结果 
测验 最 终 是 为 了 解决 一 定 的 问题 。 因 此 ,测验 是 否 有 效 ,关键 


要 看 测验 结果 如 何 使 用 , 即 能 否 对 实测 分 数 进 行 合理 、 正 确 的 解释 ， 


以 及 依据 这 些 解释 能 否 做 出 有 效 .可 行 的 决策 。 


如 果 说 ,人 们 根据 测验 目的 精心 制作 了 测验 工具 ,测验 工具 的 
优 几 根据 测验 目的 来 评 鉴 ,那么 ,工具 能 否 得 到 良好 使 用 则 与 测验 
实施 过 程 , 施 测 结果 紧密 相连 。 例 如 ,根据 阶段 单元 测验 目的 是 “为 


了 检验 学 生 是 否 做 好 学 习 下 一 阶段 知识 的 准备 ” 























命 制 出 单元 测验 





卷 ,考生 完成 单元 测验 卷 后 ,教师 没有 对 实测 分 数 进行 针对 性 的 解 





释 ( 如 ,得 分 在 多 大 程度 上 反映 出 考生 对 关键 知 


识 技能 的 掌握 情 


况 ), 也 没有 判定 这 一 分 数 能 否 作 为 开始 下 一 阶段 知识 教学 的 依据 
(如 ,可 能 学 生 知识 储备 不 足 , 不 能 进入 下 阶段 教学 ;或 者 学 生 掌 握 





情况 非常 好 ,下 阶段 教学 可 以 适当 简化 某 些 内 容 ; 
学 计划 推进 教学 进度 ,那么 这 次 单元 测验 的 效 度 就 
3. 测验 效 度 有 高 低 之 分 ,无 有 无 之 别 


等 等 ), 就 按照 教 
不 够 理想 。 





在 学 校 教学 中 , 由 于 测验 总 是 为 一 定 的 教学 目的 服务 ,也 要 解 
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决 一 定 的 教学 问题 ,因此 测验 总 是 能 够 或 多 或 少 地 反映 出 考生 的 某 
些 心理 特质 。 在 具体 评估 一 项 测验 的 效 度 时 ,人 们 往往 根据 收集 的 
信息 从 效 度 高 或 效 度 低 的 角度 加 以 验证 ,而 不 是 直接 断言 测验 有 效 


二 、 效 度 与 信和 度 的 关系 


在 经 典 真 分 数理 论 中 ,实测 分 数 的 方差 只 可 以 分 解 为 真 分 数 方 
差 o; 与 测量 误差 方差 o? 之 和 , 即 叶 = @? 十 2。 测验 信和 度 定义 为 
ra 一 只 [at 

事实 上 ,测量 误差 包括 随机 误差 和 系统 误差 两 部 分 ,由 于 系统 
误差 与 所 测 特 质 无 关 且 较为 稳定 ,因此 经 典 真 分 数理 论 在 研究 信 度 
时 把 系统 误差 放 在 真 分 数 中 不 做 进一步 分 解 。 

在 效 度 研究 中 ,系统 误差 属于 重点 研究 对 象 , 因 此 ,人 们 把 真 分 
数 方差 ? 进行 再 分 解 ,得 到 公式 2.7 














0 = 二 of， (2.7) 
即 = 十 of 十 oi?。 (2. 8) 
其 中 ,ao 表示 考生 真实 能 力 水 平 的 方差 ,of 表示 测验 中 的 系统 
误差 方差 。 
效 度 的 估算 公式 定义 如 下 : 
TA ER CR 





其 中 x, 表示 测验 的 效 度 ,o? 表示 考生 实测 分 数 方差 。 

由 于 考生 的 真实 能 力 水 平 是 测验 希望 测 到 的 ,无 法 直接 获取 ， 
此 根据 公式 2. 9 无 法 计算 出 测验 的 效 度 值 ,公式 2. 9 只 是 具有 理 
论 研 究 价值 。 

根据 公式 2. 7 与 2.9, 可 以 得 出 如 下 的 等 量 关 系 : 

















oo of—o? 0 
rr (2.10) 
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根据 公式 2. 10, 对 于 同一 份 测验 ,可 以 得 出 以 下 结论 : 

1. 效 度 值 总 是 小 于 信和 度 值 。 

2. 如 果 测验 信和 度 低 , 则 测验 效 度 肖 定 低 。 

3. 如 果 测 验 信 度 高 ,测验 效 度 不 一 定 高 ,此 时 , 效 度 的 高 低 取决 
于 系统 误差 的 大 小 ,系统 误差 大 , 则 效 度 低 ,系统 误差 小 , 则 效 度 高 。 

4. 如 果 测 验 效 度 高 , 则 测验 信 度 一 定 高 。 

与 信 度 分 析 一 样 ,在 具体 分 析 一 份 测验 时 ,也 需要 从 定性 与 定 
量 两 种 角度 来 分 析 测 验 效 度 。 


三 、 效 度 分 类 与 评估 


将 效 度 分 为 内 容 效 度 .结构 效 度 、 效 标 关 联 效 度 是 经 典 的 .公认 
的 分 类 方法 ,至 今 仍 在 效 度 研究 领域 占据 重要 地 位 ,在 中 小 学 教学 
领域 的 应 用 也 很 广泛 ,下 面 逐一 介绍 。 

1， 内 容 效 度 

(1) 内 容 效 度 的 概念 

内 容 效 度 是 指 测验 的 题目 在 多 大 程度 上 代表 了 所 和 欲 测 试 领域 
的 整个 内 容 。 例 如 ,如 果 要 测试 学 生 简单 的 算术 计算 能 力 ,那么 使 
一 份 由 30 道 四 则 运算 题 组 成 的 测验 卷 比 使 用 一 份 由 10 道 算术 应 
用 题 组 成 的 测验 卷 更 有 效 , 也 就 是 说 前 一 份 测验 卷 的 内 容 效 度 更 
好 ,测验 内 容 更 具有 代表 性 。 
教育 测验 中 ,由 于 学 生 学 习 的 知识 很 多 ,教学 应 达到 的 日 标 也 
很 丰富 ,而 测验 不 可 能 包罗 万 象 ,因此 ,只 能 选择 一 部 分 知识 、 主 要 
的 教学 目标 构建 测验 卷 作为 样本 ,去 估计 考生 的 知识 技能 掌握 情 
况 , 并 对 取样 是 否 合适 做 出 估计 。 例 如 ,从 数学 某 单元 的 内 容 中 进 
行 取样 形成 课堂 小 测验 ,用 学 生 在 这 个 题目 样本 上 所 得 的 分 数 推测 
学 生 在 相应 单元 学 习 中 知识 、 技 能 与 能 力 状 况 。 如 果 试 题 样 本 的 代 
表 性 好 ,那么 测验 Se 
测验 结果 很 可 能 产生 错误 
[ 于 学 生 所 学 的 知识 与 技能 分 为 了 解 .理解 . 掌 所、 灵活 运 / 等 
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多 种 层次 ,因此 ,在 构建 测验 卷 时 ,除了 考虑 知识 与 技能 的 代表 性 
外 ,还 必须 兼顾 知识 与 技能 的 考查 层次 .考查 方式 .呈现 形式 等 多 种 
素 , 这 样 才能 保证 测验 内 容 上 共有 较 好 的 代表 性 。 

《2) 内 容 效 度 的 评估 

目前 并 没有 简单 有 效 的 公式 用 以 计算 内 容 效 度 值 。 5 

确定 内 容 效 度 是 否 理想 的 关键 是 分 析 试题 的 取样 是 否 具有 较 
好 的 代表 性 。 一 般 要 求 试卷 中 的 每 一 道 试题 都 必须 有 自己 明确 有 
效 的 考查 目标 , 既 要 与 试卷 中 其 他 试题 相辅相成 ,又 要 为 试卷 中 别 
的 试题 无 法 代替 。 

一 般 可 以 编制 一 个 或 几 个 考试 知识 和 水 平 的 双向 细 目 表 来 检 


验 内 容 效 度 , 以 下 是 较为 常见 的 几 种 双向 细 目 表 。 
表 2-3 反映 测验 内 容 与 认 知 水 平 关 系 的 双向 细 目 表 



























































认 知 水 平 
学 习 内 容 ”| 测验 内 容 分 值 合计 
了 解 | 理解 | 掌握 | 灵活 运用 
1. 
2. 
法 则 | 上 | 3 
或 技能 | 2 
综合 | 下 
2. 
其 他 
分 值 合计 | 上 的 

















在 表 2- 3 中 ,测验 卷 的 满分 为 100 分 ,表格 主要 包括 三 大 部 分 ， 
欲 测 内 容 范围 ( 即 学 习 内 容 )、 测 验 内 容 、 测 验 内 容 所 属 的 认 知 水 平 
( 即 检验 教学 目标 的 达成 度 ) 。 根 据 该 表 , 可 以 清楚 地 了 解 测验 内 容 
对 欲 测 内 容 的 代表 程度 .测验 知识 技能 水 平 的 分 布 状况 ,从 而 评估 
测验 的 内 容 效 度 的 高 低 。 
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表 2-4 测验 内 容 . 认 知 水 平 与 测验 题 型 的 三 向 细 目 表 


题 型 空 是 选择 是 解答 题 。 | 题 数 、 
内 容 与 水 于 1|213|4|5le|7|s|9 |10l11l12|13|14|15| 分 数 小 计 

















学 习 


内 容 | 技巧 


























认 知 | 理解 加 
水 平 掌握 | | 
灵活 这 用 | | 


每 题 满分 值 515151515|1515 

































































a 
a 

a 
S 


10|10|10 


0| 100 分 


在 表 2 -4 巾 ,测验 卷 共 15 道 试题 ,满分 为 100 分 ,表格 上 主要 
包括 四 部 分 : 欲 测 内 容 范围 ( 即 学 习 内 容 )、 测 验 内 容 分 布 、 测 验 内 
容 所 属 的 认 知 水 平 ( 即 检验 教学 目标 的 达成 度 )、 测 验 题 型 的 应 用 
情况 。 该 表 对 表 2 - 2 进行 了 改进 ,对 试卷 题 型 结构 也 进行 了 
分 析 。 








在 实际 构建 双向 细 目 表 时 ,可 以 根据 具体 情况 对 上 述 两 表 进 行 
适当 增删 ,例如 ,可 以 把 试题 的 难 易 度 、 各 部 分 试题 内 容 的 比例 等 因 
素 添加 进去 ,综合 进行 分 析 。 

2. 结构 效 度 

《1) 结构 效 度 的 概念 

数学 测验 的 结构 效 度 指 测验 结果 与 被 测 学 生 所 具有 的 数学 能 
力 、 智 力 等 结构 相符 合 的 程度 ,其 目的 在 于 用 心理 学 理论 说 明 测验 
分 数 的 意义 , 即 用 心理 学 观点 对 测验 结果 加 以 解释 与 探讨 。 
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确定 一 个 测验 的 结构 效 度 ,首先 应 从 数学 能 力 结构 的 心理 学 理 
论 出 发 ,导出 各 项 关于 这 一 数学 能 力 结构 的 一 些 基 本 假设 ,再 根据 
这 些 基本 假设 设计 和 编制 试卷 进行 测验 ,得 出 测验 结果 后 ,由 果 洲 
因 ,用 实验 相关、 因素 分 析 、 聚 类 分 析 .路 径 分 析 等 方法 ,来 检验 测 
验 结果 是 否 符合 心理 学 上 关于 数学 能 力 结构 的 理论 假设 。 因 此 , 结 
构 效 度 不 能 用 单一 的 数据 指标 衡量 ,而 必须 使 用 累积 的 证 据 进行 
评价 。 

(2) 结构 效 度 的 评估 

在 常规 数学 测验 中 ,定性 分 析 结 构 效 度 时 ,可 以 从 分 析 测 验 问 
题 与 数学 解 题 心理 的 关系 、 测 验 分 数 与 其 他 考试 (如 同 质 考试 , 异 质 
考试 ) 分 数 的 相关 性 等 角度 展开 ,简易 做 法 是 :制定 试卷 的 框架 结 
构 , 题 型 结构 .能 力 结构 、 难 度 结构 ,看 看 是 否 有 利于 考生 正常 水 平 
的 发 挥 (如 是 否 有 人 为 制造 的 陷阱 ,是 否 兼顾 不 同 考生 的 学 习 专 长 ， 
试题 的 题 型 是 否 多 样 ,评价 方式 是 否 客观 …… )。 

统计 学 上 ,检验 结构 效 度 最 常用 的 方法 是 因素 统计 法 。 用 因素 
分 析 法 来 检验 测验 卷 的 结构 效 度 , 并 有 效 地 抽取 几 个 共同 因素 , 若 
这 些 共同 因素 与 数学 能 力 理论 结构 的 心理 特质 很 接近 , 则 可 以 说 此 
测验 卷 具 有 较 好 的 结构 效 度 , 并 可 以 此 作为 测验 所 测 的 特质 对 测验 
分 数 做 出 解释 。 因 素 分 析 时 ,抽取 因素 的 方法 有 很 多 ,常见 的 是 使 
用 主 成 分 分 析 法 、 极 大 似 然 估 计 法 .未 加 权 最 小 二 乘法 .广义 最 小 二 
乘法 等 ;选取 共同 因子 转轴 的 方法 包括 :最 大 变异 法 .相等 最 大 法 、 
斜 交 旋转 等 ,具体 使 用 指导 可 以 参考 相关 的 统计 书 。.O 

3， 效 标 关 联 效 度 

(1) 效 标 关联 效 度 的 概念 

效 标 关联 效 度 又 称 为 经 验 效 度 . 统 计 效 度 , 它 用 测验 分 数 和 效 
标 之 间 的 相关 系数 表示 测验 效 度 的 高 低 , 效 标 就 是 检测 效 度 的 参照 





















































































































































外 ”例如 ,可 以 参考 tSPSS 统计 运用 实务 问卷 分 析 与 应 用 统计 )j( 吴 明 隆 编著 , 北 
京 :科学 出 版 社 ,2003 年 版 ) 《SPSS 在 教育 统计 中 的 应 用 》( 杨 晓 明 主编 ,北京 :高 等 教育 
出 版 社 ,2004 年 版 ) 等 。 
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标准 。 效 标 关联 效 度 分 为 同时 效 度 和 预测 效 度 两 种 ,同时 效 度 是 指 
测验 与 当前 效 标 之 间 的 关联 程度 ,例如 ,用 高 考 成 绩 作为 效 标 来 检 
验 高 中 毕业 会 考 成 绩 , 计算 两 者 之 间 的 相关 系数 就 是 高 中 毕业 会 考 
的 同时 效 度 ;预测 效 度 指 测验 与 将 来 效 标 之 间 的 关联 程度 ,例如 ,用 
大 学 一 年 级 的 成 绩 作为 效 标 来 检验 高 考 成 绩 , 计算 两 者 之 间 的 相关 
系数 就 是 高 考 的 预测 效 度 。 

效 标 是 用 来 衡量 测验 效 度 的 尺度 , 它 不 仅 随 着 测验 种 类 的 不 同 
而 不 同 ,而 且 也 可 能 随 着 时 间 而 改变 ,现在 是 一 个 好 的 效 标 ,将 来 不 
一 定 就 是 。 

(2) 效 标 关联 效 度 的 评估 

效 标 关联 效 度 的 计算 方法 主要 是 通过 计算 各 种 相关 系数 而 求 
得 ,可 以 采用 积 差 相关 、 二 列 相关 、 点 二 列 相 关 等 。 在 常规 的 教育 测 
验 中 ,常用 学 生 最 近 若 干 次 考试 的 平均 成 绩 简单 地 作为 效 标 分 数 ， 
计算 某 次 测验 的 实测 分 数 与 效 标 分 数 之 间 的 相关 系数 来 估计 效 标 
关联 效 度 ,计算 公式 为 : 
























































PD, -D 
a D-DD 
其 中 ,X; 为 个 学 生 的 考试 分 数 ,Y; 为 n 个 学 生 的 效 标 分 数 ， 
义 、Y 为 相应 分 数 的 平均 数 。 一 般 认 为 值 大 于 或 等 于 0. 45 即 可 。 
四 、 测验 效 度 的 定性 评价 指标 


与 信 度 一 样 ,对 一 份 测验 卷 的 效 度 进行 评价 ,从 定性 的 角度 展 
开 分 析 更 有 助 于 测验 卷 命 制 质量 的 改进 。 除 了 上 述 介绍 的 通过 双 
向 细 目 表 来 检验 测验 卷 的 内 容 效 度 外 ,还 可 以 从 试题 的 异 质 性 程 
度 、 试 题 的 代表 性 程度 、 试 卷 结构 是 否 有 利于 考生 水 平 的 发 挥 等 角 
度 进行 分 析 。 表 2 - 5 给 出 了 一 个 评价 量 表 模 板 供 参考 。 





(2,11) 
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评价 指标 


表 2-5 测验 效 度 定 性 评价 表 


评定 等 级 





评价 要 点 


优 | 良 | 中 | 差 


正面 典型 


负面 典型 





《1) 试卷 知识 、 技 能 的 覆盖 率 





(2) 考查 的 知识 技能 是 否 涉及 
多 个 认 知 层次 





(3) 知识 技能 考查 方式 的 多 样 


(4) 考查 的 知识 技能 呈现 形式 
的 多 样 性 


| 








《1) 每 道 试题 考查 目标 的 有 效 
性 


(2) 每 道 试题 考查 功能 的 独特 
性 





《3) 试题 间 考查 功能 的 互补 性 
(1) 不 同 题 型 应 用 的 恰当 性 
局 


《2) 不 同 难度 试题 搭配 的 合理 
性 





(1) 是 否 有 人 为 制造 的 陷阱 





《2) 是 否 兼 顾 不 同 考 牛 的 学 习 
专长 





(3) 整 卷 的 表述 习惯 与 阅读 量 








是 否 合理 




















二 





第 三 节 测验 难度 


试卷 质量 分 析 包 括 整 卷 质量 分 析 、 试 题 质 量 分 析 两 个 层面 ,其 


h 试 题 质 量 分 析 就 是 根据 实测 资料 求 取 试题 的 难度 与 区 分 








度 , 并 研 
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究 相应 的 改进 措施 。 
一 、 难 度 概念 


难度 是 测验 试题 的 难 易 程度 ,是 对 考生 完成 试题 作答 任务 时 所 
表现 出 来 的 困难 程度 的 度量 ,也 可 以 说 是 衡量 试题 对 学 生 知识 与 能 
力 水 平 适合 程度 的 指标 。 

真 分 数理 论 中 最 简单 最 常用 的 试题 难度 指标 ,是 直接 建立 在 通 

过 率 基础 上 的 。 通 常 ,试题 的 通过 率 等 于 该 题 具 体 的 答对 人 数 与 参 
加 测验 总 人 数 之 比 ,按照 此 意 , 通 过 率 越 大 ,表示 试题 被 正确 答对 的 
难 程度 越 小 ,难度 应 该 越 小 , 即 试题 难度 应 该 定义 为 试题 的 “未 通 
过 率 "或 “ 失 分 率 "。 由 于 一 道 试 题 的 得 分 率 与 失 分 率 之 和 为 1 ,两 者 
在 数学 意义 上 是 对 等 的 ,而 实际 工作 中 测验 分 数 的 统计 往往 是 先 清 
点 答对 人 数 或 答对 分 数 , 即 先 求 出 通过 率 或 得 分 率 , 因 此 ,一 般 就 
通过 率 (得 分 率 ) 来 作为 试题 的 难度 指标 。 
于 难度 的 计算 总 是 针对 特定 的 考生 群体 而 言 的 ,离开 了 具体 
的 考生 群体 ,试题 就 谈 不 上 难度 ,因此 难度 具有 相对 性 。 例 如 ,一 道 
试题 对 于 小 学 生 而 言 可 能 很 难 ,但 对 于 中 学 生 而 言 可 能 非常 容易 。 
在 分 析 试题 难度 时 ,必须 指明 施 测 对 象 。 


二 、 难 度 的 计算 


1. 客观 题 难度 的 计算 
客观 题 的 评分 采用 “对 、 错 "方式 计 分 ,这 时 ,试题 的 难度 就 等 
答对 该 试题 的 人 数 与 参加 测验 总 人 数 的 比 ,计算 公式 如 下 : 






























































计 





一 工 
Py (2. 12) 





其 中 ,p 表示 试题 的 难度 指标 ,n 表示 参加 测验 总 人 数 ,r 表示 答 
对 该 试题 的 人 数 。 
显然 ,难度 值 p 越 大 ,题目 越 容易 ;难度 值 p 越 小 ,题目 越 难 。 
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2. 主观 题 难度 的 计算 

主观 题 的 评分 采用 “部 分 答对 给 部 分 分 数 , 全 对 给 满分 ,全 错 给 
零 分 ”的 方式 计 分 ,这 时 ,试题 的 难度 (通过 率 ) 就 等 于 试题 上 的 平均 
得 分 与 该 试题 满分 的 比值 ,计算 公式 如 下 : 





8 |8I 
S 


p= .1137 
其 中 z 是 考生 在 该 题 上 的 平均 得 分 ,x 为 该 题 的 满分 。 

3. 用 极端 分 组 法 计算 

当 考 生 人 数 较 多 时 ,无 论 是 客观 题 还 是 主观 题 , 都 可 以 采用 极 
端 分 组 法 计算 试题 的 难度 ,计算 的 具体 步骤 如 下 : 

(1) 先 按照 测验 总 分 ,由 高 到 低 ,将 考生 试卷 依次 排序 ; 

(2) 从 得 分 最 高 的 一 份 试卷 开始 ,依次 向 下 选 出 全 部 试卷 的 
27% 作 为 高 分 组 ,计算 出 高 分 组 对 应 的 各 试题 的 难度 pa; 

(3) 从 得 分 最 低 的 一 份 试卷 开始 ,依次 向 上 选 出 全 部 试卷 的 
27% 作 为 低 分 组 ,计算 出 低 分 组 对 应 的 各 试题 的 难度 pi ; 


(4) 相应 试题 的 难度 取 pu、p, 的 平均 值 , 即 户 = 名 吉 如 。 


根据 难度 上 述 的 计算 公式 可 知 ,试题 难度 值 p 的 取 值 范围 为 
0<pel1, 


三 、 难 度 的 评价 标准 


由 于 每 个 测验 都 是 由 众多 的 试题 组 成 ,一 份 测验 卷 中 各 个 试题 
的 难度 如 何 搭配 才 恰 当 ? 这 需要 具体 问题 具体 分 析 。 通 常 ,试题 难 
度 的 恰当 性 ,难度 分 配 的 恰当 性 取决 于 测验 目的 的 性 质 ( 是 标准 参 
照 还 是 常 模 参 照 ) .所 用 试题 的 类 型 (是 客观 题 还 是 主观 题 ) .试题 间 
的 相关 性 。 

对 十 标准 参照 测验 ,通过 率 越 高 ,表明 教 与 学 的 效果 越 好 ， 
此 ,不 仅 每 道 试 题 难度 的 数值 越 大 越 好 ,而 且 试 题 间 的 难度 差异 
不 必 大 。 
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对 于 常 模 参 照 测 验 , 申 于 目的 是 要 尽量 把 所 有 考生 的 水 平 差异 
加 以 区 分 ,因此 ,总 是 希望 考生 的 总 分 能 彼此 拉 开 距离 ,希望 每 个 分 
数 点 上 都 有 很 强 的 区 分 度 。 从 单个 试题 看 ,主观 题 ( 如 计算 题 、 作 
图 \ 证 明 等 ) 由 于 猜测 成 功 的 可 能 性 很 小 ,试题 难度 在 0. 5 左右 最 为 
适宜 ,因为 难度 适中 的 试题 最 有 利于 把 全 部 考生 区 别 开 来 ,过 难 或 
过 易 的 试题 不 利于 区 分 考生 。 客 观 题 由 于 存在 随机 猜测 答对 的 影 
响 ,“ 四 选 一 ”选择 题 的 适宜 难度 为 0. 7 左右 ,是 非 题 的 适宜 难度 为 
0. 85 左右 。 从 整 卷 看 , 若 测 验 中 试题 间 的 相关 性 很 高 ,这 时 ,试卷 中 
的 试题 难度 分 布 应 力争 宽 一 些 ,可 在 0. 01 至 0. 99 全 距 间作 均匀 分 
布 ;车 试题 间 的 相关 性 很 低 ,这 时 ,试卷 中 的 试题 难度 可 以 围绕 0. 5 
形成 窄 全 距 分 布 .? 

对 于 竞赛 类 的 测验 ,由 于 测验 目的 是 选拔 出 考生 中 最 优秀 的 人 
才 , 因 此 要 求 在 某 个 分 数 划 界 点 上 有 极 强 的 鉴别 力 ,以 便 把 考生 准 
确 地 分 成 录取 与 淘汰 两 类 ,因此 ,试题 难度 的 数值 就 必须 偏 小 。 


四 、 影 响 难度 的 因素 


一 般 说 来 影响 题目 难度 的 主要 因素 有 :@ 考 查 知识 点 的 多 少 ， 
@ 考 查 能 力 的 复杂 程度 或 层次 的 高 低 ;@ 考 生 对 题目 的 熟悉 程度 
(如 本 来 较 易 的 题目 会 因 考 生 均 未 注意 而 造成 很 难 ,或 本 来 较 难 的 
题目 会 因为 考生 普遍 练习 过 而 变 得 较 容易 ); @ 命 题 的 技巧 性 (如 同 
一 个 问题 ,可 以 命 得 容易 ,也 可 以 命 得 较 难 ) 。 

控制 题目 的 难度 ,除了 考虑 上 述 因 素 ,还 可 以 通过 其 他 方法 来 
控制 。 在 平常 的 教学 测验 中 , 由 于 教师 对 学 生 的 情况 比较 了 解 , 因 
而 主要 攒 经 验 来 控制 难度 ,使 之 与 教师 的 教学 难度 相 适 应 。 而 在 区 
级 .市 级 大 规模 测验 中 ,除了 经 验 ,还 需要 通过 预测 来 掌握 难度 。 首 
先 由 命题 人 员 根 据 上 述 因素 估计 一 个 难度 范围 ;然后 通过 小 样本 测 
试验 证 难度 估计 的 准确 程度 ,分 析 原 因 , 进 而 提高 评估 能 力 。 经 过 



















































































外 汪 书 青 ,现代 测量 理论 在 考试 中 的 应 用 ,江西 教育 出 版 社 ,2003,89- 95 页 。 
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预测 取得 难度 的 题目 可 以 进入 题库 ,以 备 后 用 。? 
五 、 试题 难度 的 定性 评价 


测验 完毕 ,除了 计算 出 各 题 的 难度 值 外 ,对 难度 进行 定性 评价 
也 是 常见 的 分 析 工 作 , 具 体 可 以 参考 表 2 -6 进行 。 


表 2-6 试题 难度 的 定性 分 析 表 





考生 ”| 考生 典型 错误 
典型 解法 | 及 错 因 分 析 























第 四 节 测验 区 分 度 


无 论 是 考试 的 鉴别 和 选拔 功能 ,还 是 诊断 和 信息 反馈 功能 ,都 
离 不 开 测验 卷 的 区 分 功能 ,这 种 区 分 功能 用 试题 区 分 度 来 界定 并 加 


以 测量 。 


一 、 区 分 度 的 概念 


试题 区 分 度 是 指 测验 试题 鉴别 考生 实际 能 力 水 平 高 低 的 量度 。 
考生 的 能 力 水 平 总 是 有 高 低 之 分 ,如 果实 际 水 平 高 的 考生 在 测验 题 





目 上 能 得 到 高 分 ,ff 








而 实际 水 平 低 的 考生 只 能 得 低 分 ,那么 该 试题 区 


分 考生 的 能 力 就 强 ;反之 ,就 可 以 断定 试题 的 区 分 度 不 理想 。 因 此 ， 


中 ” 胡 中 锋 , 教 育 测 


量 与 评价 ,广州 :广东 高 等 教育 出 版 社 ,2006,49 一 50 页 。 
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试题 的 区 分 度 又 被 称 为 试题 的 鉴别 力 , 它 是 评价 试题 质量 .筛选 试 
题 的 主要 指标 与 依据 。 
根据 区 分 度 的 定义 ,计算 试题 的 区 分 度 时 ,需要 先 把 考生 按照 
能 力 水 平 高 低 排序 形成 一 个 效 标 ,然后 再 考查 考生 在 试题 上 的 得 分 
情况 与 这 个 效 标 之 间 的 相关 性 ;如 果 相 关 一 致 性 高 ,就 是 区 分 鉴别 
力 强 ;如 果 相 关 一 致 性 低 , 就 是 区 分 鉴别 力 差 。 在 具体 分 析 测 验 试 
题 的 区 分 度 时 ,方法 主要 有 两 种 :外 在 效 标 法 与 内 部 一 致 性 法 。 
1. 外 在 效 标 法 
即 先 找 一 个 不 依赖 于 测验 成 绩 的 、 外 部 的 、 客 观 的 标准 ,根据 这 
个 标准 把 考生 按照 能 力 高 低 顺 序 排 好 队 , 然 后 再 看 考生 在 测验 试题 
上 的 得 分 ,顺序 是 否 跟前 者 相符 。 
然而 ,在 具体 实践 中 ,这 种 外 部 的 客观 标准 很 难 找到 。 
2. 内 部 一 致 性 法 
在 实际 操作 时 ,一 般 采 用 内 部 标准 , 即 把 考生 在 整个 测验 上 所 
得 的 总 分 当成 考生 的 实 有 水 平 。 当 然 , 这 种 做 法 在 逻辑 上 缺乏 充分 
根据 ,原因 在 于 ,总 分 是 否 正确 可 靠 ,在 分 析 工 作 尚 未 进行 之 前 ,无 
法 肯定 。 然 而 ,一 般 来 说 ,测验 都 是 经 过 一 番 设 计 的 ,全 卷 总 分 比 起 
个 别 试 题 的 得 分 来 说 ,总 是 有 可 能 更 接近 于 考生 的 实际 水 平 ;另外 ， 
以 总 分 作 标准 ,有 利于 增强 测验 试题 间 的 同 质 性 ,从 而 有 利于 提高 
整个 测验 的 信和 度 ;而 且 , 这 种 计算 也 可 以 说 明 每 个 试题 应 为 测验 日 
的 作 贡 献 , 如 果 不 一 致 ,恰好 就 说 明了 该 试题 所 测 特质 与 测验 目标 
不 -- 致 。 
所 以 ,在 实际 操作 中 ,主要 使 用 的 是 内 部 一 致 性 法 ,从 这 个 意义 
上 说 ,区 分 度 的 实质 就 是 各 试题 得 分 和 测验 总 分 的 相关 程度 。 
二 、 区 分 度 的 计算 
根据 测验 及 题目 的 不 同 计 分 方式 ,可 采用 不 同 的 公式 计算 区 分 
。 在 数学 测验 中 ,主要 采用 下 列 几 种 计算 方法 。 
1. 积 差 相关 法 
两 个 变量 都 是 正 态 连 续 变 量 且 两 变量 之 间 成 线性 关系 时 ,表示 
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这 两 个 变量 之 间 的 相关 称 为 积 差 相关 。 积 差 相 关 是 英国 统计 学 家 
皮尔 逊 在 20 世纪 初 提出 的 一 种 计算 相关 的 方法 , 故 也 可 称 为 皮尔 
撑 相 关 法 。 数 学 试卷 中 的 主观 题 ,试题 得 分 与 测验 总 分 均 为 连续 变 
量 , 所 以 一 般 采 用 积 差 相关 公式 计算 试题 的 区 分 度 , 计 算 公式 如 下 : 

















Di — 2 = 
r eu a (2. 14) 











其 中 ,zi 表示 考生 i 在 该 试题 上 的 得 分 ,zz 表示 该 试题 所 有 考生 
得 分 的 平均 分 4y 表示 考生 i 测验 的 总 得 分 ,3 表示 该 测验 卷 所 有 考 
生 总 得 分 的 平均 分 。 事 实 上 ,公式 2. 14 与 公式 2. 11 完全 相同 。 

2. 点 二 列 相关 法 

当 两 个 变量 其 中 一 个 是 连续 性 变 基 , 另 一 个 是 真正 的 二 分 名 义 
变量 (如 ,对 与 错 ) ,这 时 ,表示 两 个 变量 之 间 的 相关 , 称 为 点 二 列 
相关 。 

比如 ,在 数学 测验 中 ,客观 题 中 选择 题 答对 记 为 5 分 , 答 错 记 为 
0 分 ,这 时 ,选择 题 可 以 看 成 是 二 分 名 义 变量 ,而 测验 总 分 看 成 是 连 
续 变 量 , 这 时 便 可 采用 点 二 列 相关 法 计算 选择 题 的 区 分 度 ,计算 公 
式 如 下 : 





= gs (2 15Y 
其 中 ,ro 为 某 道 试题 的 点 二 列 相关 系数 ,p 为 该 试题 的 通过 率 ， 
9 为 该 试题 的 未 通过 率 ;z 为 该 试题 通过 者 测验 总 分 的 平均 值 ,z 为 
该 试题 未 通过 者 测验 总 分 的 平均 值 ;o, 为 测验 卷 测验 总 分 的 标准 差 。 
3. 二 列 相关 法 
当 两 个 变量 都 是 正 态 分 布 的 连续 变量 ,但 其 中 一 个 变量 被 人 为 
地 划分 成 二 分 变量 (如 按 一 定 分 数 , 把 测验 分 成 合格 与 不 合格 两 
类 ) ,这 时 ,表示 这 两 个 变量 之 间 的 相关 , 称 为 二 列 相关 。 
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例如 ,数学 测验 试题 分 数 可 以 看 成 是 连续 变量 ,而 测验 总 分 被 分 
为 及 格 .不 及 格 两 类 ,可 采用 此 法 计算 试题 的 区 分 度 ,计算 公式 如 下 : 


(2. 16) 


其 中 ,rs 为 菜 道 试题 的 点 二 列 相 关系 数 ,p、q、zp、Zo、o, 的 含 
义 同 公式 2. 15,y 为 通过 率 p 在 正 态 分 布 中 的 纵 线 高 度 。 

4. 极端 分 组 法 

采用 极端 分 组 法 计算 试题 的 区 分 度 与 前 面 计算 试 题 难度 的 步 
又 相同 ,只 是 最 后 -- 步 的 计算 公式 不 同 。 计 算 的 具体 步骤 如 下 ， 

(1) 先 按照 测验 总 分 ,由 高 到 低 , 将 考生 试卷 依次 排序 ; 

(2) 从 得 分 最 高 的 一 份 试卷 开始 , 依次 向 下 选 出 全 部 试卷 的 
27% 作 为 高 分 组 ,计算 出 高 分 组 对 应 的 各 试题 的 难度 pa; 

(3) 从 得 分 最 低 的 一 份 试卷 开始 , 依次 向 上 选 出 全 部 试卷 的 
27% 作 为 低 分 组 ,计算 出 低 分 组 对 应 的 各 试题 的 难度 pi ; 

(4) 相应 试题 的 区 分 度 是 pu 与 pr 的 差 , 即 D = pn 一 pi。 

为 了 与 按照 相关 法 计算 的 区 分 度 加 以 区 别 , 有 人 又 将 极端 分 组 
法 计算 的 区 分 度 称 为 试题 的 鉴别 力 指 数 。 这 种 估计 区 分 度 值 的 方 
法 在 日 常 测验 的 分 析 活 动 中 使 用 较为 简便 。 


三 、 区 分 度 的 评价 标准 


- 般 地 ,试题 的 区 分 度 是 利用 相关 系数 的 方法 计算 得 到 的 ,所 

以 ,理论 上 试题 区 分 度 的 取 值 在 一 1. 00~1. 00 之 间 。 如 果 试 题 的 区 

分 度 为 负 ， pe es be 4 到 

除 ; 如 果 区 分 度 为 正 ,那么 区 分 度 到 底 多 高 才 算 好 ? 艾 伯 尔 就 选择 

区 分 度 值 提出 了 评价 标准 ,具体 要 求 如 表 2 -7。 对 于 有 些 要 求 不 
高 的 测验 ,有 些 试题 的 区 分 度 低 一 些 也 是 容许 的 。? 
































人 D ” 滚 书 青 ,现代 测量 理论 在 考试 中 的 应 用 ,武汉 :华中 师范 大 学 出 版 社 ,2006,98 页 。 
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表 2-7 试题 区 分 度 的 评价 标准 























区 分 度 后 评 价 
0.40 以 上 优秀 
0. 30~0. 39 良好 ,如 能 改进 更 好 
0. 20 一 0. 29 尚 可 ,用 时 需 作 改进 
0. 19 以 下 A 劣 ,必须 淘汰 或 改进 以 提高 区 分 度 后 方 可 使 用 











在 实施 完 测验 后 ,根据 表 2 - 7 解释 试题 的 区 分 度 时 ,需要 注意 
以 下 两 类 问题 : 

1, 教育 测验 中 ,区 分 度 值 一 般 为 正 

计算 试题 区 分 度 时 ,如 果 出 现 区 分 度 值 为 负数 的 现象 , 则 暗示 
该 试题 可 能 测量 的 是 不 同 的 心理 结构 ,不 适用 目前 所 要 测量 的 心理 

2. 当 试 题 区 分 度 小 于 0.29 甚至 0.2 时 ,不 一 定 说 明 试 题 
不 好 

造成 试题 的 区 分 度 偏 小 的 原因 很 多 ,需要 具体 问题 具体 分 析 。 
分 析 时 ,以 下 几 种 情况 需要 综合 考虑 。 

(1) 参加 测验 人 数 的 多 少 。 如 果 参 加 测验 人 数 太 少 ,可 能 会 导 
致 区 分 度 值 不 稳定 。 

(2) 试题 的 难度 。 同 一 道 试题 对 于 不 同 考生 群体 可 能 难度 益 异 
很 大 , 如 果 试 题 难度 过 大 或 过 小 ,都 可 能 导致 区 分 度 降低 。 

(3) 试题 命 制 质量 。 试 题 的 结构 .表述 等 都 可 能 对 考生 作答 造 
成 干扰 ,影响 考生 的 临场 发 挥 , 从 而 影响 试题 的 区 分 度 。 
如 果 能 够 排除 上 述 三 个 方面 的 因素 ,那么 就 需要 从 教师 教学 或 
学 生 复 习 等 方面 来 反思 教学 实践 中 可 能 存在 的 问题 。 


、 区 分 度 与 难度 、 信 和 度 的 关系 


1. 区 分 度 与 难度 
每 个 试题 都 具有 难度 、 区 分 度 两 个 技术 指标 ,在 计算 出 测验 卷 
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中 所 有 试题 的 难度 、 区 分 度 值 后 ,可 以 将 每 个 试题 的 这 两 个 技术 指 
标 作为 点 (难度 .区 分 度 ) ,在 图 2- 1 所 示 的 难度 值 为 横 轴 、 区 分 度 为 
纵 轴 的 直角 坐标 系 中 标示 出 来 ,进行 质量 性 能 的 综合 评价 。 一 般 而 
言 ,点 落 在 区 域 W 以 外 的 题目 都 要 引起 注意 ,尤其 是 落 在 区 域 1 与 
区 域 耻 中 的 试题 必须 认真 分 析出 现 这 种 情况 的 原因 ,务必 保证 以 后 
测验 中 遇 到 类 似 的 题目 必须 修改 或 淘汰 。 


























ey 
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 难度 





围 2=1 


另外 ,对 常 模 参照 性 测验 来 说 ,试题 的 难度 在 0. 5 左右 时 ,区 分 
度 较 好 ;难度 接近 1 或 0 的 试题 ,无 区 分 度 可 言 。 对 目标 参照 性 测验 
而 言 ,试卷 的 区 分 度 意义 不 大 。 
表 2-8 区 分 度 的 最 大 值 与 难度 的 关系 









难度 (P) 





区 分 度 的 最 大 值 1.00 | 0. 60 | 0. 20 














表 2 - 8 可知, 难度 适中 的 试题 区 分 度 最 大 。 

2. 区 分 度 与 信 度 

试题 的 区 分 度 与 测验 卷 的 信 度 之 间 也 有 着 紧密 的 联系 。 表 
2 -9 是 艾 伯 尔 1972 年 发 表 的 ,这 里 试卷 信 度 是 在 假定 全 部 试题 难度 
均 为 0. 50 的 前 提 下 预测 得 到 的 , 表 中 的 区 分 度 指 的 是 试卷 中 所 有 
试题 区 分 度 的 平均 值 。 
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表 2-9 区 分 度 与 测验 信 度 的 关系 

















区 分 度 信和 度 区 分 度 信和 度 
0. 1225 0. 00 0. 30 0. 84 
0. 16 0. 42 0. 40 0. 915 
0. 20 0. 63 0. 50 0. 949 




















根据 表 2 -9 可 知 , 当 试题 难度 确定 时 , 随 着 试卷 区 分 度 增 大 , 测 
验 信 度 也 增 大 。 可 见 ,要 想 达 到 理想 的 测验 信和 度 ,提高 区 分 度 是 一 
个 好 方法 。 

五 、 影 响 试卷 区 分 度 的 因素 

影响 测验 卷 与 试题 区 分 度 的 因素 有 很 多 ,如 ,试题 的 难度 ; 整 卷 
的 难度 分 布 ; 试题 得 分 点 的 层次 性 ; 试题 的 解 题 方法 的 多 样 性 ， 
等 等 。 

- 般 而 言 , 若 要 提高 试题 的 区 分 度 , 则 尽 可 能 多 地 考查 解答 过 

程 较为 复杂 的 问题 ,使 得 能 力 高 的 考生 能 得 遍 分 ,能 力 差 的 考生 得 
低 分 ,考生 成 绩 尽 量 分 布 在 整个 分 数量 尺 上 。 


第 五 节 EXCEL 与 SPSS 软件 应 用 实例 


随 着 计算 机 技术 的 发 展 与 家 用 电脑 的 普及 , 绝 大 多 数 教师 部 会 
使 用 微软 办 公 系 统 (Microsoft Office) 中 的 EXCEL 软件 处 理 简单 的 
数据 与 图 表 , 而 汉化 版 的 SPSS 软件 含义 清晰 ,操作 简便 ,因此 ,学 会 
使 用 EXCEL 软件 与 汉化 版 的 SPSS 软件 进行 简单 的 试卷 质 其 分 析 
也 很 容易 。 


一 、 计算 测验 信和 度 
【 例 2-1】 初 三 A 班 共 有 10 名 学 生 , 表 2-10 是 A 班 一 次 数 
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华 长 将 等 攻 己 莉 朋 葡 腿 工 南 志 也 冰 一 班 YV_ 0T-z 从 
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学 期 未 测验 的 原始 成 绩 统计 表 , 该 数学 期 末 测 验 卷 由 25 首 题 组 成 ， 
其 中 1~10 题 为 选择 题 ,每 题 3 分 :11 一 16 题 为 填空 题 ,每 题 3 分 ; 
17 一 25 题 , 为 解答 题 , 分 值 依 次 为 9、9、10、10、12、 12、 12、 14、14 
分 ;试卷 满分 为 150 分 。 试 计算 该 次 测验 的 信 度 。 

解 : 由 于 整 份 测验 卷 中 包含 填空 题 、. 选 择 题 . 解 答题 等 多 种 是 
型 ,是 每 题 的 分 值 也 不 尽 相同 ,因此 ,选择 使 用 公式 2. 6 计算 a 系数 
估计 测验 信 度 。 

方法 1: 利用 EXCEL 软件 计算 ,分 为 三 步 进行 。 

第 一 步 ,计算 每 道 题目 的 标准 差 ; 

标准 差 的 计算 采用 函数 “STDEV”, 在 单元 格 B12 中 键入 “= 
STDEV(B2:;B11)”, 按 Enter 键 ,返回 值 0. 00 就 显示 在 单元 格 B12 
中 。B12 表示 的 是 第 1 题 实测 分 数 的 标准 差 。 

将 光标 放 在 单元 格 B12 右 下 角 直 到 显示 为 “十 ”, 按 住 左 键 拖 动 
光标 ,就 可 以 得 出 第 2~25 题 以 及 测验 总 分 的 标准 差 。 如 图 2 - 2 
所 示 。 






































第 二 步 , 计 算 每 道 题目 的 方差 
方差 等 于 标准 差 的 平方 ,在 单元 格 B13 中 键入 “= B12 x B12”， 





按 Enter 键 ,返回 值 0. 00 就 显示 在 单元 格 B13 中 。B13 表示 的 是 第 
1 题 实测 分 数 的 方差 ,如 图 2-3 所 示 。 

将 光标 放 在 单元 格 B13 右 下 角 直 到 显示 为 “十 ”, 按 住 左 键 拖 动 
光标 ,就 可 以 得 出 2 一 25 题 以 及 测验 总 分 的 方差 。 如 图 2-3 所 示 。 
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第 三 步 ,计算 测验 卷 信 度 的 内 部 一 人 





1 
根据 公式 2.6， 用 “一 了 Ai 来信 计 测 验 信 度 。 在 


单元 格 B14 中 键入 "= (1 一 SUM (B13:213)/AA13) x 25/24”, 按 
Enter 键 ,返回 值 0. 33 就 显示 在 单元 格 B14 中 。 如 图 2 -4 所 示 。 








1 
3 
3 
3 
3 
3 
3 
了 
3 


6 0.98 "0.00 "1.26 "0.00 
下 Om Le oo0 





图 2-4 


所 以 ,该 测验 信 度 的 内 部 一 致 性 系数 约 为 0. 33。 

方法 2: 利用 SPSS 软件 计算 ,分 两 步 进行 

第 一 步 , 在 SPSS 数据 编辑 器 中 单 击 “ 加 ,找到 保存 为 扩 展 名 
是 “. xls” 的 电子 表格 文件 ,然后 根据 提示 ,把 在 EXCEL 软件 中 整理 
的 考生 各 题 的 得 分 数据 与 总 分 数据 导入 SPSS 数据 编辑 器 中 (本 书 
使 用 的 是 SPSS12. 0Windows 汉化 版 ), 如 图 2-5 所 示 , 并 将 之 保存 
为 例 2 - 1. sav 文件 。 
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图 2-6 


接着 ,执行 一 系列 操作 。 单 击 “ 可 靠 性 分 析 ” 后 ,出 现 “ 可 靠 性 分 
析 ” 对 话 杠 ,如 图 2- 7, 将 xl 一 x25 选 入 右边 的 “项 ” 方 框 中 , “模型” 
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栏 选择 “a”; 然 后 单 击 “ 统 计量 "按钮, 出现“ 可 靠 性 分 析 : 统 计量 ” 子 
对 话 框 ,如 图 2- 8, 在 “项 之 间 ” 方 框 中 ,选取 “相关 性 ”, 单 击 “继续 ” 
按钮 回 到 “可 靠 性 分 析 ” 对 话 框 , 单 击 “ 确 定 ”按钮 ,得 出 结论 。 
































可 知性 分 析 : 统计 号 
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图 2-8 
结论 中 出 现 * 警 告 : 在 分 析 中 计算 并 使 用 协 方差 矩阵 。 以 下 每 
一 个 分 变量 均 有 为 零 的 方差 ,并 且 已 从 刻度 中 移 去 , xl， x2，x3， 
x4，x5，x6，x7，xl10，x12，xl15，x17，x18， x20”, 并 给 出 下 表 
全 


表 2-11 可 靠 性 统计 量 








和 
Cronbach's Alpha | 基于 标准 化 项 的 Cronbachs Alpha | 项 数 





0.349 | 0.646 | 12 





从 表 2 -11 可 以 看 出 ,科隆 巴赫 a 系数 值 是 0. 349, 去 除 13 道 是 
后 ,科隆 巴赫 a 系数 值 是 0. 646。 , 

【说 明 】 由 于 考生 样本 过 小 ,只 有 10 人 ,因此 用 这 个 小 样本 的 
实测 分 数 来 估计 测验 信 度 显然 数值 偏 低 。 

【 例 2-2】 初 三 年 级 共有 439 人 ,测验 卷 的 结构 与 例 2-1 中 的 
相同 , 求 该 次 期 末 的 数学 测验 信 度 。 

解法 1: 利用 EXCEL 软件 ,与 例 2 - 1 中 的 解法 1 同样 的 步 又 
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计算 ,如 图 2- 9 所 示 : 
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图 2-9 
所 以 ,该 2008 学 年 初 三 数学 期 末 测 验 信 度 的 内 部 一 致 性 系数 
约 为 0.91。 
解法 2: 利用 SPSS 软件 ,与 例 2 - 1 中 的 解法 2 同样 的 步骤 计 
算 ,文件 保存 为 “ 例 2 - 2. sav”, 得 到 结果 如 下 : 
表 2-12 可 靠 性 统计 量 





Cronbach's Alpha 基于 标准 化 项 的 Cronbachs Alpha | 项 数 





0. 925 0. 942 25 


【说 明 】 对 比例 2-1 与 例 2-2, 当 考生 群体 增 大 时 ,测验 信 度 
也 显然 增 大 ;同时 ,由 于 考生 的 水 平分 布 广 ,也 提高 了 测验 信和 度 。 


二 、 计 算 测 验 效 度 


【 例 2-3】 初 三 年 级 共有 439 人 ,测验 卷 的 结构 与 例 2 - 1、 
2 -2 中 的 相同 ,请 用 SPSS 软件 分 析 该 次 期 末 数 学 测验 的 结构 效 度 。 
解 : 第 一 步 ,打开 例 2- 2. sav 文件 。 
第 二 步 , 执行 【分析 ] 人 [数据 降 维 ] 人 因子 分 析 ] 程序 , 如 图 
2 -10。 单 击 " 因 子 分 析 ” 按 钮 ,出 现 * 因 子 分 析 ” 对 话 框 ,将 左边 方 杠 
中 的 题目 xl 一 x25 选 入 右边 的 “变量 "下 的 空 框 中 ,如 图 2-11。 
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图 2-11 
第 三 步 ,对 “因子 分 析 ” 中 的 五 个 按钮 < 描述”"“ 抽 取 ”“ 旋 转 ”、 
“得 分 ”“ 选 项 ”中 的 选项 进行 选择 ,基本 的 选择 项 与 选择 方法 如 图 


2-12、2-13,、2-14. 2-15., 2-16 所 示 , 每 个 选项 选择 完 后 , 单 
“继续 "按钮 ,返回 图 2- 11。 
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图 2-12 
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WR 
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“确定 ”按钮 ,就 得 到 一 系列 的 因素 分 析 结 果 。 
表 2-13 KMO 和 Bartlett 的 检验 











U 





图 2-15 
步 , 当 “因子 分 析 "的 相关 选项 都 完成 后 , 按 图 2 - 11 中 的 





因子 分 析 : 蓝 转 
:方法 


个 最 大 方差 法 0 
信 直接 0blinin 方法 人 个 Fo 站 


Dlta): 厅 


-显示 
末 旋 秒 解 丫 ) 六 要 而 图 Q) 


最 大 收藏 性 选 代 次 涂 GD) 一 


图 2-]14 


因子 分 本: 


























取样 足够 度 的 Kaiser - Meyer - Olkin 度量 0. 966 
近似 卡 方 5872. 588 
Bartlett 的 球形 度 检验 df 300 
Sig. | 000 





根据 表 2 -13, KMO 值 为 0.966, 表明 本 测验 非常 适合 进行 因 
素 分 析 ( 判 别 标准 :KMO 之 0.9 时 ,非常 适合 ;0. 8<KMOS0.9 时 ， 
适合 ;0. 7 二 KMO<0.8 时 ,一 般 ;0.5 二 KMO<0.7 时 ,不 太 适 合 ; 


KMO<<0.5 时 ,不 适合 0) ; Bartlett 球形 度 检 验 的 x 值 为 5872. 588 


中 杨 晓 明 主 编 ,SPSS 在 教育 统计 中 的 应 用 ,北京 :高 等 教育 出 版 社 ,2004 年 5 月 第 


一 版 。 
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5 自由 度 为 300) 达 到 显著 水 平 ,表示 测验 试题 中 共同 因素 存在 ,适合 







































































进行 因素 分 析 。 
表 2-14 公 因 子 方差 (提取 方法 : 主 成 分 分 析 ) 
初始 | 提取 初始 | 提取 初始 | 提取 

wt 1.000 .241 X10 1.000 .267 x18 1.000 .742 
x2 1.000 435 ll 1.000 .580 x19 1.000 .680 
x3 | 1.000 | .419 | xl2 | 1.000 | .291 | x20 | 1.000 | .760 
x4 1.000 .558 x13 1.000 .608 x21 1.000 .643 
x5 | 1.000 | .400 ‖ xl4 | 1.000 
x6 | 1.000 | .508 || x15 | 1.000 
x7 | 1.000 | .527 | xl6 | 1.000 
x8 | 1.000 | .522 | xl7 | 1.000 

A si 
| | wa 

表 2-14 中 ,利用 主 成 分 分 析 法 ,得 到 25 个 题 项 的 共同 性 。 共 








同性 越 高 ,表示 该 题 与 其 他 题目 可 测量 的 共同 特质 越 多 , 即 该 题 的 
重要 性 越 大 。 显 然 解 答题 x17 一 x25 的 重要 性 比 选择 题 x1~x10、 填 


空 题 xl1 一 xl16 都 高 。 


表 2-15 解释 的 总 方差 





[一 一 























志 初始 特征 值 提取 半 方 和 载 入 旋转 平方 和 载 入 (a) 
> 合计 | 方差 的 中 累积 % | 合计 | 方差 的 %%| 累积 % 合计 
1 |10.850| 43.400 | 43.400 |10.850| 43. 400| 43.400 9. 529 
2 | 1.636| 6.546 |49.946 | 1.636| 6.546| 49.946 5. 839 
3 | 1.087| 4.348 | 54.294 | 1.087 4 348| 54. 294 5. 386 
4 .940| 3.760 |58.054 
5 .864| 3.456 |61.510 
6 .844| 3.375 | 64. 885 
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《 续 表 ) 










































































g 初始 特征 值 提取 平方 和 载 入 旋转 平方 和 载 入 (a) 
ES 合计 | 方差 的 %| 累积 中 | 合计 | 方差 的 %| 累积 % 合计 
7 | .798 | 3.191 | 68.075 

8 | .746 | 2.984 | 71.060 | 
9 | .712 | 2.848 | 73.908 

10 | .678 | 2.714 | 76.621 

11 | 2.526 | 79. 147 

12 | .567 | 2.268 | 81.416 

13 | 538 2.156 | 83.571| 

14 | .502 | 2.008 | 上 580 

15 | .461 | 1.844 | 87.423 [ 

16 | .430 | 1.720 | 89.144 

17 | .417 | 1.667 | 90.810 

18 | .397 | 1.587 | 92.397 

19 | .361 | 1.443 | 93.840 

20 | .320 | 1.279 | 95.118 

21 | .307 | 1.229 | 96.348 

22 | .267 | 1.069 | 97.417 

23 | .239 | .957 | 98.374 

24 | .209 | .837 | 99.211 

25 | .197 | .789 |100.000 




















提取 方法 : 主 成 分 分 析 。 
a 使 成 分 相关 联 后 , 便 无 法 通过 洪 加 平方 和 载 入 米 获得 总 方差。 

表 2-15 中 ,初始 特征 值 栏目 中 ,“ 合 计 ” 栏 为 特征 值 ,共有 25 个 
素 , 与 试题 总 数 相等 ,表示 的 是 每 个 成 分 解释 的 试题 方差 总 量 ; 
“方差 的 % "为 解释 的 方差 比例 ,例如 成 分 1 解释 的 方差 占 总 方差 的 
43. 4 中 ,如 果 因 子 分 析 效 果 好 ,应 该 出 现 很 少数 的 因子 解释 很 大 比 
例 的 方差 的 情况 ; “累积 %” 为 解释 的 累积 方差 比例 ,可 见 前 三 个 成 
分 解释 的 方差 占 了 总 方差 的 54. 294%。“ 提 取 平 方 和 载 入 ”栏目 中 ， 
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”以 特征 值 等 于 1 为 抽取 标准 , 共 抽 取 了 3 个 主 成 分 (公共 因子 )。“ 旋 
转 平方 和 载 入 ”栏目 中 ,由 于 执行 的 是 斜 交 旋转 ,公共 因子 间 是 相 
的 ,具有 公共 方差 ,因此 ,解释 的 方差 无 法 在 公共 因子 之 间 做 分 配 ， 
但 从 “合计 ”一 栏 可 以 看 出 ,旋转 后 ,三 个 主 成 分 之 间 特 征 值 的 差异 
明显 缩小 ,由 原来 的 “10. 850、1. 636、1. 087” 变 为 “9. 529、5. 839、 
5. 386”。 

表 2-16 是 保留 了 三 个 主 成 分 后 的 因子 负荷 矩阵 ,由 于 主 成 分 
1 的 可 解释 的 方差 占 总 方差 的 比例 高 达 43. 4%, 而 主 成 分 2、 
3 的 可 解释 的 方差 占 总 方差 的 比例 却 分 别 仅 为 6. 546% 、4- 348%， 
与 主 成 分 1 相差 过 大 ,因此 需要 对 主 成 分 进行 旋转 后 重新 提取 。 执 
行 斜 交 旋转 后 ,得 到 模式 矩阵 如 表 2 - 17, 它 显示 的 是 旋转 后 ,每 道 
试题 在 三 个 主 成 分 上 的 负荷 ,每 个 负荷 值 实际 上 就 是 相应 的 试题 与 
旋转 后 的 因子 的 偏 相关 系数 。 

转轴 后 的 三 个 公共 因子 ,每 个 因子 的 题目 数 比较 适当 ,三 个 因 
子 所 包含 的 题 项 分 别 为 : 

因 志 第 100 TY T2813 Ld 19 16% 208 DI 23 2 
25 题 ; 

因子 2: 第 1、2、5、17、18、19、22 题 ; 

因子 3: 第 3、4、6、7、8 题 。 

结合 测验 卷 中 具体 的 试题 ,可 以 给 因子 1 命名 为 “综合 推理 的 
方法 与 技巧 ”, 因 子 2 命名 为 “基本 概念 与 法 则 的 理解 与 运用 ”, 因 子 
3 命名 为 “基本 计算 技巧 的 使 用 ”, 那 么 该 份 测验 卷 考查 考生 数学 能 
力主 要 从 这 三 个 方面 进行 的 。 

表 2-18 与 表 2-17 的 形式 相同 。 如 果 执 行 的 是 正 交 旋 转 , 见 
模式 矩阵 与 结构 矩阵 相等 ;如 果 执 行 的 是 斜 交 旋 转 ,结构 矩阵 比 模 
式 矩阵 复杂 ,这 时 ,矩阵 中 的 相关 系数 既 受 试题 与 成 分 间 的 相关 关 
系 影响 ,又 受到 因子 间 的 相关 关系 影响 , 具体 数据 的 计算 可 以 结合 
表 2-17 与 表 2-19 共同 进行 ,计算 方法 可 以 参考 相关 的 SPSS 使 用 
指导 书 。 
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(8) 刺 弱 作 逢 91-7 化 
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第 二 
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“ 梁 址 如 攻 蛋 琅 : 当 交道 群 
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“ 梁 声 攻 寻 独 二 : 梁 企 得 帮 
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第 二 章 


甫 2-19 成 分 转换 矩阵 

















eR 
1 1. 000 | .406 480 
2 .406 | 1. 000 .368 
3 .480 .368 | 1. 000 








提取 方法 : 主 成 分 分 析 法 。 
旋转 法 :具有 Kaiser 标准 化 的 斜 交 旋转 法 。 
在 使 用 和 斜 交 旋转 时 ,由 于 结构 矩阵 的 解释 非常 复杂 ,一 般 情况 
下 ,只 是 检查 模型 矩阵 的 因子 负荷 ,并 对 其 作出 解释 。 
表 2- 19 为 主 成 分 与 主 成 分 之 间 的 相关 系数 矩阵 ,可 以 看 出 主 
成 分 之 间 的 相关 性 比较 适当 。 表 2 - 20 为 成 分 得 分 系数 矩阵 ,根据 
该 矩阵 ,可 以 计算 每 个 考生 在 各 个 主 成 分 上 的 得 分 。 例 如 ,计算 某 


个 考生 在 成 分 1 上 的 得 分 ,计算 方法 为 :成 分 1 的 得 分 = Dn x 


zi 其 中 ;表示 成 分 1 与 第 i 题 的 相关 系数 ,在 表 2 -19 的 入 阵 中 可 
以 查 得 ,x; 为 试题 i 的 得 分 。 当 测试 具有 足够 的 代表 性 时 ,这 一 结果 
比 原始 成 绩 更 能 具体 地 反映 考生 在 能 力 结构 上 的 差异 。 


三 、 计 算 试题 的 难度 


【 例 2 - 4】 初 三 年 级 共有 439 人 ,测验 卷 与 例 2-2、2 - 3 中 的 
相同 ,请 利用 EXCEL 软件 计算 全 年 级 该 次 期 未 数学 测验 的 每 道 试 
题 的 平均 分 和 难度 。 

解 : 在 具体 操作 时 ,客观 题 与 主观 题 的 难度 都 采用 公式 2. 13 来 
计算 。 

第 一 步 , 在 全 体 考生 成 绩 下 面 第 441 行 放 入 各 题 的 满分 值 ,如 
图 2-17 中 第 441 行 所 示 。 
第 二 步 , 计算 各 题 的 平均 分 。 平 均 分 的 计算 采用 函数 
“AVERAGE”, 在 单元 格 B442 中 键入 "一 AVERAGE(B2:B440)”， 
按 Enter 键 , 返 回 值 2. 8 就 显示 在 单元 格 B442 中 。B442 表示 的 是 
全 年 级 第 1 题 的 平均 分 。 
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第 二 


将 光标 放 在 单元 格 B442 右 下 角 直 到 显示 为 “十 ”, 按 住 左 键 拖 
动 光标 ,就 可 以 得 出 全 年 级 第 2~25 题 以 及 测验 卷 的 平均 分 。 如 医 
2-17 中 第 442 行 所 示 。 
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图 2-17 





第 三 步 , 计算 各 题 的 难度 。 在 单元 格 B443 中 键入 “= B442/ 
B441)”, 按 Enter 键 , 返 回 值 0. 93 就 显示 在 单元 格 B443 中 。B443 
表示 的 是 全 年 级 第 1 题 的 难度 。 

将 光标 放 在 单元 格 B443 右 下 角 直 到 显示 为 “十 ”, 按 住 左 键 拖 
动 光标 ,就 可 以 得 出 全 年 级 第 2~25 题 以 及 测验 卷 的 难度 。 如 图 2 - 
26 中 第 443 行 所 示 。 


四 、 计 算 试题 的 区 分 度 


【 例 2-5】 初 三 年 级 共有 439 人 ,测验 卷 与 例 2-2、2-3、2- 
4 中 的 相同 ,请 利 月 EXCEL 软件 计算 全 年 级 该 次 期 末 数 学 测验 的 
每 道 试题 的 区 分 度 。 

解 : 本 题 的 区 分 度 计算 采用 高 、 低 分 组 的 方法 ,月 EXCEL 软件 
分 四 步 进行 。 

第 一 步 , 确 定 全 年 级 439 人 中 高 分 组 与 低 分 组 的 人 数 , 即 439X 
27%=180 人 。 

第 二 步 , 将 全 年 级 考生 按照 测验 总 分 由 高 到 低 排序 。 

如 图 2- 18, 执 行 [数据 ]/[ 排 序 ] 程 序 , 出 现 图 2 - 19 的 “排序 ” 
























































64 / 数学 试卷 分 析 方法 


对 话 框 。 在 “主要 关键 字 ” 栏 目 选择 “sum” 与 “降序 ”, 即 首先 按照 总 
分 把 数据 由 高 到 低 降序 排列 。 单 击 “确定 ”按钮 , 即 得 到 排序 后 的 考 
生 数 据 。 
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第 三 步 ,计算 各 题 和 总 分 的 高 分 组 难度 与 低 分 组 难度 。 

在 单元 格 B442 中 键入 “= SUM(B3: B182)/(180 x B2)”, 按 
Enter 键 ,返回 值 1. 00 就 显示 在 单元 格 B442 中 。B442 表示 的 是 高 
分 组 180 名 考生 第 1 题 的 难度 。 

将 光标 放 在 单元 格 B442 右 下 角 直 到 显示 为 “十 ”, 按 住 左 键 拖 
动 光标 ,就 可 以 得 出 高 分 组 180 名 考生 第 2 一 25 题 以 及 测验 总 分 的 
难度 。 如 图 2- 20 所 示 。 
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图 2-20 


在 单元 格 B443 中 键入 “二 SUM(B260:B439)/(180 x B2)”, 按 
Enter 键 ,返回 值 0.9 就 显示 在 单元 格 B443 中 。B443 表示 的 是 低 
分 组 180 名 考生 第 1 题 的 难度 。 

将 光标 放 在 单元 格 B443 右 下 角 直 到 显示 为 “十 ”, 按 住 左 键 拖 
动 光标 ,就 可 以 得 出 低 分 组 180 名 考生 第 2 一 25 题 以 及 测验 总 分 的 
难度 。 如 图 2- 21 所 示 。 
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图 2-21 


第 四 步 , 计 算 各 题 与 测验 卷 的 区 分 度 。 

在 单元 格 B444 中 键入 “二 B442 一 B443”, 按 Enter 键 , 返 
0. 1 就 显示 在 单元 格 B444 中 。B444 表示 的 是 第 1 题 的 区 分 度 。 

将 光标 放 在 单元 格 B444 右 下 角 直 到 显示 为 “十 ”, 按 住 左 键 扼 
动 光标 ,就 可 以 得 出 第 2 一 25 题 以 及 测验 总 分 的 区 分 度 。 如 图 2 - 22 
所 示 。 
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图 2-22 


{ 例 2-6】 初 三 年 级 共有 439 人 ,测验 卷 与 例 2-2、2-3、2- 
4、2 -5 中 的 相同 ,请 利用 SPSS 软件 用 高 低 分 组 法 分 析 全 年 级 该 次 
期 末 数 学 测验 每 道 试题 的 区 分 度 , 并 检验 其 显著 性 。 

解 : 区 分 度 的 分 析 分 为 四 步 进 行 

第 一 步 ,确定 全 年 级 439 人 中 高 分 ;组 与 低 分 组 的 人 数 , 妈 439Xx 
27%= 二 180 人 ,然后 确定 高 分 组 的 分 数 分 布 是 116 分 至 最 高 分 , 低 分 
组 的 分 数 分 布 是 最 低 分 至 87 分 。 

第 二 步 ,将 全 年 级 考生 按照 测验 总 分 由 高 到 低 排序 。 

如 图 2-23, 执 行 [数据 ]/[ 对 个 案 排序 ] 程 序 ,出 现 图 2 -24 的 
“个 案 排 序 ” 对 话 框 。 将 左边 变量 名 “sum” 选 中 放 入 右边 “排序 方式 ” 
下 的 方 框 中 ,在 “排序 顺序 ”中 选择 “降序 ”方式 , 单 击 “ 确 定 ” 按 钮 , 即 
把 全 部 数据 按照 总 分 进行 了 由 高 到 低 的 排列 。 
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图 2 一 24 


第 三 步 , 选 出 高 、 低 分 组 27% 的 分 数 , 作 为 高 、 低 分 组 的 界限 (高 


分 组 为 第 1 组 , 低 分 组 为 第 2 组 )。 


图 2-26 





“名 称 ” 吕 
方 框 中 的 
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2 -25, 执 行 [转换 ]A【 重 新 编码 ]/[ 成 不 同 变量 ] 程 序 ,出 现 


的 “重新 编码 为 其 他 变量 ”对 话 框 。 将 左边 变量 名 "sum” 选 
中 放 入 右边 “数字 变量 一 输出 变量 ”下 的 方 框 中 ,在 “输出 变量 栏目 
Rh 输入 “group”, 单 击 “ 更 改 按 钮 ,数字 变量 一 输出 变量 ”下 
内 容 由 原来 的 ‘sum 一 ?” 变 为 “sum 一 group”。 
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图 2-26 
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单 击 “ 旧 值 和 新 值 (Q)…” 按 钮 ,出 现 * 重 新 编码 到 其 他 变量 : 旧 


值 和 新 值 ”的 子 对 话 框 ,如 图 2- 27 所 示 。 











图 2-27 


在 左边 “ 旧 值 ? 方 框 中 ,由 上 到 下 选择 第 5 个 选项 “全 距 (G):”， 
人 值 到 ”后 面 的 空格 内 输入 低 分 组 界限 “87”( 表 示 最 低 分 至 

7 分 ), 在 右边 “新 值 ” 方 框 中 ,选择 “ 值 ”, 在 后 面 的 空格 内 输入 “2” 
2 组 ), 然 后 单 击 “ 添 加 ”按钮 ,在 “ 旧 一 新 ”下 的 方 框 
中 出 现 “Lowest thru 87 一 2”, 表示 数据 中 总 分 在 87 分 以 下 的 考生 
为 低 分 组 (第 2 组 )。 

同样 地 ,在 左边 “ 旧 值 ” 方 框 中 ,由 上 到 下 选择 第 6 个 选项 “全 距 
(G):", 在 “到 最 大 值 ”前 面 的 空格 内 输入 高 分 组 界限 “116”( 表 示 116 
分 至 最 高 分 ) ,在 右边 “新 值 ” 方 框 中 ,选择 “ 值 ”, 在 后 面 的 空格 内 输 
入 “1”( 高 分 组 设 为 第 1 组 ) ,然后 单 击 “ 添 加 ”按钮 ,在 “ 旧 一 新 ”下 的 
方 框 中 出 现 “116 thru 87 Highest->1”, 表 示 数 据 中 总 分 在 116 分 以 
上 的 考生 为 高 分 组 (第 1 组 )。 如 图 2- 27 所 示 。 

图 2-27 中 , 单 击 “ 继 续 ” 按 钮 , 回 到 “重新 编码 到 其 他 变量 : 旧 值 
和 新 值 ” 的 子 对 话 框 , 再 单 击 “确定 ”按钮 ,数据 文件 的 窗口 中 新 增 一 
个 “group” 的 变量 ,变量 值 为 1( 高 分 组 ) 或 2( 低 分 组 )。 
第 四 步 , 用 工 检 验 来 检验 测验 卷 高 . 低 两 组 在 各 个 试题 上 的 差异 。 

如 图 2 一 28, 执 行 [分 析 ]/【 比 较 均值 ]/【[ 独 立 样本 工 检 验 ] 程 序 ， 
出 现 图 2 - 29 的 “独立 样本 工 检验 ?对 话 框 。 将 左边 变量 * x1~x25, 
sum” 选 中 放 入 右边 “检验 变量 ”下 的 方 框 中 。 
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图 2-29 


将 图 2 - 29 左边 变量 “group” 选 中 放 入 右边 “分 组 变量 ”下 的 方 
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框 中 ,出 现 图 2 - 30 的 “group(??)”, 单 击 “ 定 义 组 ”按钮 出现“ 定义 
组 ”于 对 话 框 ”, 选 择 “ 使 用 指定 值 ”, 在 “组 1” 后 的 空格 中 输入 1, 在 
“组 2" 后 的 空格 中 输入 2, 单 击 “继续 ”按钮 , 回 到 “独立 样式 检验 ” 























对 话 框 , 单 击 “ 确 定 ” 按 钮 。 





Mt 被 立 样式 了 检验 
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在 “输出 一 SPSS 浏览 器 ”中 出 现 以 高 低 两 组 为 自 变 量 ` 以 xl1 一 
x25 为 因 变 量 所 进行 的 独立 样本 工 检验 的 结果 ,如 表 2 -21 与 表 2- 
22 所 示 。 











表 2-21 组 统计 量 




























































































题 号 | 高 低 分 组 人 数 均值 标准 差 均值 的 标准 误 

1.00 182 2.97 .314 .023 

1 
3 2.00 182 2.57 1.053 .078 
1.00 182 3.00 .000 .000 

E74 
2.00 182 2. 44 1. 173 .087 
1.00 182 2. 80 .747 .055 

x3 
2.00 182 1. 86 1.460 108 
1. 00 182 2.92 .492 .036 

x4 
2 111 
1. 016 

x5 
.078 
a .016 

x6 
部 elk 
1 .040 

x7 
2. 110 
1. .036 

x8 
2. 110 
.086 

x9 
1.246 092 
492 .036 

x10 
1.478 110 
492 036 

xll 
1.381 102 
747 055 

xl2 
1. 501 111 
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( 续 衷 ) 































































































区 本 
题 号 高 低 分 组 人 数 均值 标准 差 均值 的 标准 误 
1.00 182 2.27 1 288 .095 
13 
2.00 182 .13 617 .046 
1.00 182 2.72 .875 065 
x14 T 
200 | 182 5 1. 464 108 
1.00 182 2.88 579 .043 
15 
2.00 182 1.02 1. 426 106 
i 182 | 2.42 1. 186 .088 
x16 
2.00 i 1.131 .084 
Lo0 | 182 8.84 | 818 .061 
xX. 
2..00 182 4.04 3.714 .275 
一 | hs 
人 1.00 182 8.91 .734 .054 
x18 fr 
2.00 182 4. 09 4. 030 | 299 
1.00 182 9.79 | 053 .078 
x19 | 一 
2.00 182 4.29 4. 555 .338 
j 和 
1.00 182 9.35 1. 697 .126 
x20 la3 
2.00 182 1.86 2. 689 .199 
T 一 
1.00 182 10. 44 3.744 278 
pe 2.00 182 76 1.547 11 
.54 5 
| — 
1.00 182 11.61 1. 357 101 
x22 必 
2.00 182 6. 64 4. 875 361 
{io0 182 | 11.38 2. 101 156 
x23 
2.00 | 182 .85 2. 500 .185 
1.00 182 | 12.64 2. 332 173 
x24 
2.00 182 1.48 2. 600 193 
1.00 182 560 | 2.663 197 
X25 ] 
.0 入 
2.00 ew | 25 735 .055 
1.00 182 [133.42 8.575 .636 
gui 
2.00 182 | 47.73 24. 830 1. 840 
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在 结果 分 析 中 , 表 2 - 20 为 高 、 低 两 组 的 描述 性 统计 量 , 包 括 组 
别 、 个 数 . 平 均 数 .标准 差 . 平 均 数 的 标准 误 , 表 2 - 21 为 工 检验 的 结 
果 , 在 查阅 报表 时 , 先 看 每 个 题 组 别 总 体 方差 相等 的 “F 检验 ”, 如 果 
F 值 显著 (显著 性 一 栏 的 值 小 于 0.05), 表 中 假设 方差 相等 不 成 立 ， 
再 在 “不 假设 方差 帆 等 ”栏目 的 荆 值 ,如 果 显 著 ( 显 著 性 一 栏 的 值 小 
于 0.05), 则 表明 此 题 具有 鉴别 度 。 显 然 , 上 述 试题 的 鉴别 度 都 是 极 
其 显著 的 。 

如 果 下 值 不 显著 (显著 性 一 栏 的 值 大 于 0.05) ,表明 两 组 的 方差 
总 体 相 等 ,再 看 “假设 方差 相等 ?栏目 的 T 值 ,如 果 显 著 (显著 性 一 栏 
的 值 小 于 0. 05), 则 表明 此 题 具 有 鉴别 度 。 

另外 ,判断 两 组 平均 数 差异 检验 的 工 值 是 否 显著 ,也 可 以 考虑 
差异 值 的 95% 的 置信 区 间 , 如 果 95% 的 置信 区 闻 为 不 包括 0 在 内 ， 
表明 两 组 的 差异 显著 ;如 果 包 括 0 在 内 ,表明 天 组 的 平均 数 有 可 能 
相等 ,两 者 的 差异 就 不 显著 。 
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测验 成 绩 的 统计 处 理 


运用 教育 统计 的 方法 对 测验 成 绩 进 行 处 理 与 分 析 主 要 包括 两 
种 类 别 , 第 一 种 是 描述 统计 , 即 把 测验 成 绩 及 其 相关 信息 进行 整理 、 
概括 ,目的 在 于 将 大 量 零散 、 杂 乱 无 序 的 数字 资料 进行 归纳 ,总结 ， 
使 事物 的 全 貌 及 其 分 布 特征 清晰 ,明确 地 显现 出 来 。 第 二 种 是 推断 
统计 , 即 根据 测验 提供 的 信息 ,运用 概率 的 理论 进行 分 析 与 论证 ,在 
一 定 可 靠 度 上 对 考生 总 体能 力 分 布 特征 进行 估计 与 推测 ,目的 在 于 
根据 已 知情 况 推断 未 知 ,为 下 一 步 决策 做 准备 。 这 两 个 类 别 相互 联 
系 ,其 中 描述 统计 是 推断 统计 的 基础 ,推断 统计 通过 样本 信息 估计 、 
推测 总 体 ,从 已 知情 况 估计 .推测 未 知情 况 。 本 章 主要 介绍 运用 描 
述 统计 组 织 和 整理 测验 成 绩 , 第 四 章 主要 介绍 运用 推断 统计 分 析 测 
验 成 绩 。 























第 一 节 数据 的 特点 与 种 类 


教育 测验 的 结果 以 数据 的 形式 呈现 。 由 于 不 同 特点 和 种 类 的 
数据 ,需要 采用 不 同 的 数据 处 理 和 转换 的 方法 ,因此 ,对 数据 进行 处 
理 前 ,必须 首先 明确 数据 的 特点 和 种 类 。 


一 、 数 据 的 常见 三 种 分 类 
根据 不 同 的 标准 可 以 将 数据 分 为 不 同 的 种 类 。 
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1. 按照 数据 的 来 源 分 类 

按照 数据 的 来 源 , 可 以 将 数据 分 为 点 计数 据 和 度量 数据 。 

点 计数 据 是 指 计 算 个 数 所 获得 的 数据 。 如 学 校 数 、 班 级 数 、 学 
生 数 教师 数 、 考 室 数 .教学 仪器 数 等 。 

度量 数据 是 指 用 一 定 的 工具 或 一 定 的 标准 测量 所 获得 的 数据 。 
例如 ,用 体重 秤 测 得 学 生 的 体重 的 数据 ,用 时 钟 测 得 学 生 完成 某 项 
作业 所 用 时 间 的 数据 ,用 单元 测验 获得 学 生 该 单元 知识 技能 掌握 情 
况 的 数据 ,等 等 。 

2. 按照 数据 的 取 值 特征 分 类 

按照 数据 的 取 值 特征 ,可 以 将 数据 分 为 离散 型 数据 和 连续 型 
数据 。 

离散 型 数据 的 取 值 是 间断 的 ,数据 单位 独立 ,两 个 单位 之 间 不 
能 再 划分 成 细小 的 单位 ,数据 一 般 用 整数 表示 。 例 如 ,参加 单元 测 
验 的 男生 人 数 、 女 生 人 数 ;测验 获得 优 、 良 、 中 、 差 各 个 等 级 的 人 数 ， 
等 等 。 

连续 型 数据 的 取 值 可 以 看 成 来 自 于 实数 集合 ,它们 可 能 的 取 值 
范围 能 连续 充满 实数 集 的 某 一 个 区 间 , 数 据 的 单位 之 间 可 以 再 划分 
成 无 限 多 个 细小 的 单位 , 即 数据 可 以 用 小 数 表示 。 例 如 ,学 生 的 身 
高 ,体重 ,智商 ,测验 成 绩 等 ,都 属于 连续 型 数据 。 

3， 按 照度 量 数据 所 用 的 测量 量 表 分 类 

按照 度量 数据 所 用 的 测量 量 表 等 级 , 可 以 将 数据 分 为 定 类 数 
据 、 定 序数 据 、 定 距 数据 和 定 比 数据 。 

定 类 数据 是 指 用 定 类 量 表 测 量 表示 的 数据 ,用 以 表示 研究 对 象 
所 属 的 类 别 ,没有 顺序 性 、 等 距 性 、 可 加 性 ,不 能 对 数据 进行 大 小 
较 ,更 不 能 对 数据 进行 加 减 乘 除 运算 。 例 如 ,男生 用 “1 表示 , 女 二 
用 2" 表示 ,这 里 的 “1”“2? 既 无 大 小 之 别 ,也 不 能 参与 加 减 乘除 
运算 。 
定 序数 据 是 指 用 定 序 量 表 测 量 表示 的 数据 ,表示 按 大 小 ,轻重 、 
等 第 等 特征 依次 排列 的 测量 属性 ,这 类 数据 具有 顺序 性 ,但 不 具备 











二 CC 
































80 / 数学 试卷 分 析 方法 


等 距 性 与 可 加 性 ,可 以 进行 大 小 比较 ,但 是 不 能 参与 加 减 乘 除 运算 。 
例如 ,学 生 测验 成 绩 划分 为 优 、 良 .中 、 差 四 个 等 级 ,分 别 用 1、2、3、 
4 表示 ,这 些 数据 具有 大 小 顺序 ,具有 传递 性 ,但 不 能 参与 加 减 乘除 

定 距 数据 是 指 用 定 距 量 表 测 量 表示 的 数据 ,表示 测量 遵循 统 
的 单位 ,相等 的 点 与 点 之 间 的 距离 也 是 相等 的 , 即 测量 特征 具有 顺 
序 性 ,等 距 性 ,可 以 进行 大 小 比较 ,也 可 以 参加 加 减 运算 ,但 是 不 能 
参与 乘除 运算 (因为 定 距 变 量 没 有 绝对 零点 ,例如 测验 得 0 分 不 表 
示 该 考生 相应 的 能 力也 为 0) 。 

定 比 数据 是 指 用 定 比 量 表 测 量 表示 的 数据 , 除 含有 定 距 数据 的 
特征 之 外 ,还 有 绝对 的 零点 ( 即 表示 被 测量 的 属性 完全 没有 ), 因 此， 
可 以 加 减 乘除 四 则 运算 。 

一 般 地 ,物理 测量 中 所 使 用 的 数据 大 都 是 定 距 数 据 和 定 比 数 
据 , 而 教育 测量 中 获得 的 数据 以 定 序数 据 . 定 距 数 据 居多 。 


二 、 表 示 测 验 成 绩 的 数据 的 基本 特点 


1. 同一 次 测验 中 的 分 数 都 是 定 距 数据 

教育 测验 中 的 分 数 基 本 上 采用 百分制 ,百分制 本 质 上 是 一 种 定 
序 量 表 , 它 只 是 规定 了 同一 类 别 中 数据 的 大 小 顺序 ,并 不 要 求 每 个 
排名 之 间 的 距离 是 一 样 的 ,如 ,不 要 求 "20 分 与 10 分 之 间 的 差别 ”等 
于 “60 分 与 50 分 之 间 的 差别 ”。 然 而 ,在 教育 实践 中 ,人 们 通常 假设 
同一 次 测验 中 “每 1 分 都 是 等 值 ? 的 (虽然 事实 上 不 等 值 ), 即 假设 百 
分 制 是 定 距 量 表 , 对 表示 测验 成 绩 的 数据 进行 有 关 的 加 减 运算 。 

在 教育 实践 中 ,为 了 从 测验 分 数 中 获取 更 多 的 信息 ,人 们 还 对 测 
验 分 数 进行 有 关 的 乘除 运算 、 乘 方 与 开 方 运算 (如 计算 测验 信和 度 、 效 度 
等 ), 实 际 上 把 百分制 又 看 成 了 定 比 基 表 ,这 是 违背 测量 原理 的 ,例如 ， 
在 一 次 数学 测验 中 ,学 生 A 得 80 分 ,学 生 B 得 40 分 ,学 生 A 的 分 数 是 
B 的 分数 的 两 倍 , 但 是 人 们 不 能 说 学 生 A 的 相应 数学 能 力 是 学 生 了 的 
2 倍 , 因 为 ,测验 的 零 分 并 不 代表 数学 能 力 为 零 。 然 而 ,由 于 可 以 解决 
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部 分 实际 问题 ,有 时 候 人 们 有 意 忽 略 这 种 逻辑 矛盾 。 

另外 ,不 同 测验 的 原始 分 数 事实 上 不 等 值 ,如 果 要 把 不 同 测验 
上 的 原始 分 数 进行 加 减 运 算 , 理 论 上 应 该 把 这 些 原始 分 数 转化 为 标 
准 分 数 , 即 转化 到 同一 个 单位 下 的 定 距 量 表 中 ,才能 进行 下 一 步 的 
处 理 。 但 是 ,在 实际 操作 中 ,为 了 快捷 地 、 部 分 地 解决 问题 ,有 时 候 
人 们 也 有 意 忽略 这 种 使 用 前 提 , 直 接 进行 了 不 同 测验 间 原 始 分 数 的 
简单 相 加 。 
2. 测验 分 数 形式 上 是 客观 数据 ,本 质 上 带 有 主观 特征 
教育 测验 测量 的 是 学 生 的 能 力 状况 , 它 是 - -种 心理 特质 ,只 能 
采用 间接 测验 的 方法 通过 学 生 对 测验 试题 的 反应 情况 去 推断 其 心 
理 活动 的 特点 与 水 平 。 测 验 时 ,所 使 用 的 测验 卷 是 由 命题 者 命 制 ， 
测验 效 度 如 何 受 限 于 命题 者 的 主观 认识 与 能 力 ,考生 答题 情况 也 受 
限于 考生 参加 考试 的 身心 状态 ,而 表示 考生 水 平 的 测验 分 数 也 受 限 
于 评 卷 教师 对 评分 标准 的 制定 与 使 用 水 平 。 因 此 ,测验 分 数 形式 上 
体现 为 客观 数据 ,实质 上 含有 很 多 主观 成 分 ,在 使 用 这 些 数据 进行 
分 析 推 断 时 ,需要 慎重 考虑 ,不 能 武断 地 给 出 类 似 “ 分 数 低 , 则 能 力 
就 差 ” 的 结论 。 

3. 测验 分 数 刻 画 的 事物 特征 具有 不 确定 性 与 模糊 性 

由 于 测验 分 数 表示 事物 特征 具有 较 多 主观 性 ,处 理 测验 分 数 的 
方式 也 比较 粗糙 ,因此 用 测验 分 数 刻画 事物 特征 并 不 是 精确 的 , 它 
更 多 带 有 不 确定 性 与 模糊 性 的 特点 。 这 种 不 确定 性 与 模糊 性 更 基 
本 ,更 深刻 地 反映 了 教育 测验 的 客观 现实 ,因为 精确 性 是 相对 于 某 
种 实际 需要 而 言 的 ,是 模糊 性 被 忽略 、 扬 弃 大 量 次 要 因素 后 的 特例 。 
在 处 理 测验 结果 、 解 释 测验 结果 时 更 需要 使 用 模糊 数学 的 方法 进行 
研究 ,不 能 过 高 苟 求 测验 结果 处 理 的 精确 性 。 
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无 论 是 学 校 常规 教学 中 的 测验 ,还 是 大 规模 的 教育 考试 ,获得 
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的 测验 数据 都 比较 多 。 如 果 对 每 一 个 实测 分 数 作 分 析 处 理 , 不 仅 
需要 花费 大 量 的 时 间 与 精力 ,而 且 效 果 未 必 理 想 。 对 这 些 测验 数 
据 进行 适当 组 织 ,可 以 使 得 数据 中 蕴含 的 规律 显现 ,而 且 易 于 
理解 。 

任何 数据 组 织 与 整理 的 第 一 步 都 是 从 数据 的 排序 开始 的 。 整 
理 数据 时 ,需要 借助 一 些 有 效 的 方法 对 数据 进行 分 组 ,排序 与 对 比 。 

【 例 3-1】 表 3-1 是 高 二 (2) 班 58 名 学 生 某 次 单元 测验 的 成 
绩 , 请 找 出 测验 成 绩 的 最 高 分 .最 低 分 与 众 数 。 测 验 成 绩 在 分 数 范 

















围 内 是 否 均匀 分 布 ? 
表 3-1 高 二 (2) 班 58 名 学 生 某 次 单元 测验 成 绩 
































显然 ,直接 根据 表 3 - 1 来 回答 例 3 - 1 的 几 个 简单 问题 ,显得 很 
不 容易 。 但 如 果 掌 握 了 一 些 快速 组 织 数 据 的 方法 ,那么 解答 这 几 个 
问题 就 显得 很 容易 了。 


一 、 茎 叶 图 


茎 叶 图 是 一 种 非常 有 效 的 探索 数据 分 布 状况 的 数据 分 析 方 法 ， 
它 的 操作 非常 容易 掌握 。 现 在 ,把 表 3 -1 中 的 数据 利用 茎 叶 图 表示 
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如 图 3 -1, 竖 线 左边 的 数据 表示 茎 ,代表 每 个 数据 十 位 上 的 数 
字 ; 竖 线 右边 的 数据 表示 叶 , 代 表 每 个 数据 个 位 上 的 数字 。 最 右边 
列 的 数字 表示 包含 在 这 一 组 中 的 数据 个 数 。 
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9 | 0011334 7 
8 | 000114455779 12 
7 | 2344555666666667889 19 
6 | 002256888899 12 
5 | 245577 6 
418 二 
i . 
N= 58 


图 3-1 表 3-1 教 据 的 茎 叶 图 


根据 图 3 - 1 ,现在 可 以 很 容易 地 回答 例 3 - 1 的 问题 ,最 高 分 是 
94 分 ,最 低 分 是 37 分 , 众 数 是 76 分 ,显然 数据 的 分 布 并 不 均匀 , 绝 
大 多 数 的 数据 落 在 60 一 80 之 间 。 另 外 ,人 们 还 可 以 读 出 其 他 的 
些 有 用 的 信息 。 

茎 时 图 的 主要 优点 是 保留 了 数据 的 所 有 细节 信息 ,但 是 , 当 数 
据 基 太 大 时 ,这 种 优点 又 变 成 了 缺点 ,比如 会 导致 茎 很 长 或 叶子 很 
多 。 当 数据 过 多 时 ,可 以 先 对 数据 进行 一 些 折 中 的 处 理 , 比 如 ,如 果 
要 画 出 0~999 之 间 的 100 个 数据 的 茎 叶 图 时 ,可 以 把 每 个 数据 的 个 
位 数字 截 去 , 蕉 表示 百 位 上 的 数字 , 叫 .表示 十 位 上 的 数字 ,这 样 得 到 
的 修正 后 的 茎 叶 图 保留 了 数据 的 主要 特征 ,有 效 信息 也 得 到 较 好 的 

{ 例 3-2】 表 3-2 是 高 二 (1) 班 38 名 学 生菜 次 单元 测验 的 成 
绩 , 请 用 茎 叶 图 比较 同一 次 单元 测验 中 ,该 班 与 例 3 - 1 中 的 高 二 (2) 
班 的 成 绩 情 况 。 
表 3-2 高 二 (1) 班 38 名 学 生 某 次 单元 测验 成 绩 



























































2 
98 87 82 77 T 74 90 89 级 95 90 
94 有 84 85 85 93 77 84 75 99 
a 
91 99 92 80 钥 | 92 79 91 94 75 
99 73 85 74 87 93 98 94 
a ， 
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解 : 图 3-2 是 包含 了 高 二 (1) .高 二 (2)? 两 个 班级 考试 成 绩 的 共 
叶 图 ,其 中 葵 放 在 中 间 , 葵 左边 的 时 表示 高 二 (1) 班 的 分 数 , 茎 右边 
的 叶 表 示 高 二 (2) 班 的 分 数 。 


























高 二 (1) 班 高 一 (2) 班 
9999885444332211100 9 0011334 
9775554420 | 8 | 000114455779 
977755443 | 7 | 2344555666666667889 
6 | 002256888899 
3 245577 
4 8 
“|b 


图 3-2 两 个 班 单 元 测验 成 绩 的 茎 叶 图 





从 图 3-2 可 以 很 明显 地 看 出 ,高 二 (1) 班 的 成 绩 远 远 高 于 高 二 
《2) 班 的 成 绩 。 基 本 上 可 以 断言 ,高 二 (1) 班 应 该 属于 类 似 由 数学 特 
长 生 组 成 的 特长 班 。 

需要 特别 注意 的 是 ,使 用 茎 叶 图 进行 两 组 数据 的 比较 时 ,需要 
两 组 观察 数据 个 数 相近 或 相等 。 当 两 组 数据 数量 相差 很 大 时 ,可 能 
会 出 现 错误 的 解释 。 


二 、 频 数 分 布 表 


频数 即 某 个 数据 出 现 的 次 数 ,频数 分 布 即 一 批 数 据 中 各 个 
不 同 数值 所 出 现 的 次 数 的 情况 。 整 理 一 批 数 据 时 ,除了 使 用 荣 
叶 图 外 ,对 数据 进行 分 组 归 类 ,考查 这 批 数据 在 各 个 等 距 组 
次 数 分 布 情况 ,并 把 这 种 情况 用 规范 的 表格 表示 出 来 ,这 就 是 频 
数 分 布 表 , 这 种 方法 在 初步 理解 数据 的 基本 信息 时 也 很 有 用 。 
表 3-3 是 例 3-1. 例 3-2 中 的 两 个 班 菜单 元 测验 成 绩 的 频数 分 
布 表 。 
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表 3-3 两 个 班 某 单元 测验 成 绩 的 频数 分 布 甫 
































分 数 段 ee 
高 二 (1) 高 二 (2) 

[£90, 100) 19 和 
[80, 90) 10 12 
[70, 80) 9 19 
[60, 70) 1 0 12 
[50, 60) 0 6 
[40, 50) 0 1 
[30, 40) 0 1 

合计 | 38 58 











与 茎 叶 图 相 比 ,频数 分 布 表 损失 了 原始 数据 的 信息 ,但 是 呈现 
数据 分 布 规律 时 显得 很 清晰 ,有 时 候 , 这 种 分 析 主题 更 突出 。 

虽然 频数 很 有 用 ,但 如 果 还 想 进 行 更 细致 的 分 析 , 寻找 对 数据 
更 深层 的 解释 ,需要 一 种 简便 快捷 的 数据 ,例如 可 以 将 频数 转化 为 
频率 (相对 百分比 ?来 解决 问题 。 这 时 , 表 3 - 3 可 以 用 表 3 -4 的 形 
式 呈 现 。 

















表 3-4 两 个 班 某 单元 测验 成 绩 的 频率 分 布 表 
































频 数 
分 数 段 
高 二 (1) 高 二 (2) 
[90, 100) 0. 50 0. 121 
[80, 90) 0. 263 0. 207 
[70, 80) 上 0. 237 0. 328 
[60, 70) 0 0. 207 
[50, 60) 0 0. 103 
[40, 50) 0 0.017 
[30, 40) 0 0.017 
| 
合计 1.00 1.00 
一 一 一 一 上 
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运用 表 3 -4 来 分 析 两 个 班 的 成 绩 . 避 免 了 两 个 班 总 人 数 不 同 的 
间 题 ,显得 说 服 力 更 强 。 
高 二 (2) 班 学 生 A 考 了 80 分 ,请 分 析 他 在 班级 中 所 








[ 例 3-3] 
处 的 位 置 。 


要 知道 学 生 A 的 分 数 是 高 还 是 低 , 需 要 根据 其 他 学 生 的 分 数 分 
布 情况 来 判断 。 利 用 茎 叶 图 (图 3 - 1) 可 以 很 清晰 地 数 出 学 生 A 排 





在 班级 的 第 17 一 19 名 ,处 于 班级 的 中 上 水 平 。 








另外 ,人 们 也 可 以 用 累计 频数 (频率 ) 分 布 表 进行 分 析 。 如 表 
3 -5, 约 有 67.2% 的 分 数 比 学 生 A 的 分 数 低 , 也 就 是 说 学 生 A 的 分 
数 处 于 67. 2% 百 分 位 数 点 ,这 种 表述 比 “处 于 班级 的 中 上 水 平 " 更 令 
































人 信服 。 
表 3-5 高 二 (2) 班 某 单 元 测验 成 绩 的 频数 分 布 表 
分 数 段 频数 累计 频数 累计 频率 (%) 
[90, 100) 和 58 100 
[80, 90) 过 | 51 87.9 
[70, 80) 19 39 67.2 
[60, 70) 12 20 34.5 
[50, 60) 6 8 | .8 
[40, 50) . | 2 3.4 
[30, 40) 1 1 1.7 








需要 注意 的 是 ,一 个 孤立 的 分 数 是 没有 分 析 意 义 的 ,必须 把 一 


个 百 分 位 数 放 在 相应 的 组 中 进行 比较 才 有 意义 。. 比 如 , 八 年 级 学 生 
D 说 他 在 某 项 数学 能 力 测试 中 的 百 分 位 点 是 88 ,而 测验 组 都 是 由 八 
年 级 学 生 组 成 ,得 到 这 个 分 数 很 好 ,但 不 出 奇 ;但 如 果 测 验 组 都 是 由 











高 三 学 生 组 成 ,那么 就 需要 对 学 生 D 刮目相看 了 。 
三 、 频 数 分 布 直方 图 
为 了 更 直观 .更 形象 地 表达 一 个 频数 分 布 的 结构 形态 及 其 特 
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征 , 人 们 可 以 从 频数 分 布 表 出 发 ,绘制 出 相应 的 频数 分 布 直方 图 。 
3-3 是 根据 表 3 - 5 绘制 的 高 二 (2) 班 某 单元 测验 成 绩 频 数 分 布 
直方 图 。 
































对 
分 数 


图 3-3 高 二 (2) 班 某 单 元 测验 成 绩 频数 分 布 直方 图 


一 般 地 , 横 轴 代表 测验 分 数 , 其 测验 分 数 的 下 限 决 定 着 横 轴 刻 
度 的 起 始 位 置 ,然后 按照 适当 的 比例 等 间隔 地 标示 出 频数 分 布 各 组 
的 组 中 值 (图 3 - 3 中 标 出 35、45、55、65、75、85、95); 纵 轴 表 示 频 
数 , 按 比例 等 间隔 地 标 出 刻度 (图 3 - 3 中 标 出 0、5、10、15、20 即 
可 ) ,其 刻度 往往 从 “0” 开 始 。 

直方 图 虽然 直观 形象 ,但 是 也 有 美中不足 ,人 们 不 容易 准确 \ 快 
速 地 了 解 各 组 中 频数 的 大 小 。 因 此 ,有 人 也 把 各 组 频数 分 别 标注 在 
各 个 直方 条 的 顶端 ,以 便 阅读 。 

















第 三 节 测验 分 数 的 图 表 表 示 








图 形 和 表格 是 数据 整理 与 分 析 中 不 可 缺少 的 部 分 ,它们 帮 
们 依据 研究 目的 与 研究 内 容 组 织 、 总 结 和 解释 数据 。 当 使 用 图 表 
时 ,数据 更 容易 理解 和 解释 ,也 更 容易 让 人 记 住 。 


一 、 图 形 的 特点 
在 第 二 节 中 ,人 们 已 经 接触 到 一 些 统计 图 (如 茎 叶 图 、 直 方 图 )， 
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好 的 统计 图 具有 一 些 共同 的 特点 及 其 一 般 形式 ,这 些 共 同 的 基本 特 
点 能 够 确保 以 尽量 简单 的 方式 准确 地 展示 数据 。 
. 统计 图 都 放置 在 直角 坐标 系 中 (有 时 候 , 直 角 坐 标 系 没有 直 
接 显示 出 来 ) 。 
2， 横 轴 (z 轴 ) 用 来 表示 自 变 量 , 纵 轴 (y 轴 ? 用 来 表示 因 变 量 。 
分 析 时 ,用 自 变 量 来 预测 ,描述 或 解释 因 变量 的 变化 。 
3. 横 轴 (z 轴 ) 与 纵 轴 (y 轴 ) 都 有 明确 的 标识 。 所 有 的 统计 图 都 
必须 包括 测量 的 尺度 .变量 的 名 称 以 及 图 示 说 明 。 
4， 横 轴 (z 轴 ) 与 纵 轴 (y 轴 ) 的 单位 长 度 比 按照 黄金 分 割 作画 。 
即 图 形 的 宽度 约 为 高 度 的 1.7 倍 , 这 样 的 图 形 最 美观 。 
5. 纵 轴 (y 轴 ) 标 示 连 续 数 据 ,没有 充分 的 理由 ,不 能 断 开 纵 轴 
(y 轴 )。 
6. 统计 图 中 只 给 出 和 数据 有 关 的 信息 。 一 般 情况 下 ,不 需要 在 
图 中 的 点 , 线 上 标注 具体 数值 。 因 为 图 形 的 目的 是 为 了 让 读者 有 一 
个 快速 直观 的 印象 ,而 不 是 数据 的 具体 内 容 。 如 果 需 要 给 出 具体 的 
细节 信息 ,那么 使 用 表格 。 


二 、 常 用 统计 图 


1. 条 形 图 

条 形 图 是 用 宽度 相同 的 长 条 表示 各 个 统计 对 象 之 问 的 数量 关 
系 , 它 在 考试 数据 分 析 中 经 常用 到 。 它 具有 以 下 三 个 独特 的 特征 。 

(1) 横 轴 表示 的 是 定 类 数据 或 定 序数 据 。 

当 数据 代表 的 是 不 同类 别 或 者 不 同等 级 的 情况 时 ,就 使 用 条 















































































































































(2) 长 条 与 长 条 之 间 是 间断 的 。 

由 于 模 轴 表示 的 是 定 类 数据 或 定 序数 据 ,因此 一 个 长 条 代表 一 
个 类 别 ,表明 这 些 类 别 是 离散 的 。 

(3) 纵 轴 可 以 表示 频数 、 百 分 数 ,或 其 他 描述 性 统计 量 。 

【 例 3-4】 表 3-6 是 一 道 “ 四 选 一 ”型 选择 题 的 各 选择 支 答题 
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情况 统计 ,请 用 条 形 图 表示 该 题 各 个 选项 情况 。 
表 3-6 一道 选 择 题 答题 情况 统计 








选 A 率 选 B 率 选 C 率 | 选 D 率 





12.79% 19. 26% 61. 18% 5.51% 


1.24% 








解 : 如 图 3-4, 其 中 横 轴 表示 选择 题 选择 支 的 分 类 ,未 选 率 用 


NO 表示 ; 纵 轴 表示 的 是 选择 各 个 选项 的 百分数 。 


70.00% 





60.00% 





地 50.00% 





本 40.00% 











种 30.00% 





20.00% 











10.00% 
0.00% 


[3 
A 


© 
选择 支 
图 3-4 一 道 选择 题 答题 情况 条 形 图 


2. 直方 图 
直方 图 与 条 形 图 的 最 主要 的 区 别 有 两 点 : 
(1) 横 轴 表示 的 数据 类 型 不 同 。 











NO 


直方 图 的 横 轴 表 示 的 数据 属于 定 距 数据 或 定 比 数 据 , 数 据 代表 


的 分 数 呈 现 出 由 左 向 右 、 从 低 值 到 高 值 的 连续 变化 。 
(2) 长 条 呈现 形式 有 别 。 





直方 图 也 用 长 条 表示 数据 ,每 个 长 条 代表 一 个 类 区 间 , 类 区 间 








就 是 有 确定 上 限 与 下 限 的 数值 取 值 范围 。 由 于 直方 
的 是 连续 变量 ,因此 ,长 条 与 长 条 间 没 有 缝隙 。 























图 的 横 轴 代 表 


除了 图 3 - 3 所 示 的 频数 分 布 直方 图 外 ,常见 的 还 有 频率 分 布 直 
方 图 , 即 从 各 个 小 组 数据 在 样本 容量 中 所 占 比例 大 小 的 角度 ,来 表 
示 数 据 的 分 布 规律 。 图 3- 5 是 根据 表 3 -4 中 的 数据 绘制 出 的 高 二 














(2) 班 菜单 元 测验 成 绩 频 率 分 布 直方 图 。 
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图 3-5 高 二 (2) 班 某 单 元 测验 成 绩 频 率 分 布 直方 图 


3-5 中 ,测验 分 数 共 分 为 7 组 ,组 距 是 10( 分 ), 横 轴 表 示 测 
验 分 数 , 纵 轴 表 示 频 率 /组 距 。 由 于 每 个 长 条 (小 长 方形 ) 的 面积 一 
组 距 关 频 率 / 组 距 一 频率 , 即 频 率 分 布 直方 图 是 以 面积 的 形式 反映 
数据 落 在 各 个 小 组 的 频率 的 大 小 ,所 以 各 个 长 条 面积 总 和 等 于 1 。 

需要 注意 的 是 ,同样 一 组 数据 ,如 果 组 距 不 同 , 横 轴 、 纵 轴 的 单 
位 不 同 , 得 到 的 直方 图 形状 也 会 不 同 。 不 同 的 形状 给 人 以 不 同 的 印 
象 , 这 种 印象 有 时 会 影响 人 们 对 总 



































体 的 判断 。 | 9 
3. 茎 叶 图 -| 
上 节 已 经 详细 介绍 了 茎 叶 图 的 动 匡 号 请 

使 用 与 它 的 种 种 优点 , 它 既 是 用 于 Et 
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了 解数 据 的 上 具 , 也 是 展示 数据 的 
有 效 方法 。 荟 叶 图 除了 前 面 介绍 的 
呈现 形式 外 ,还 可 以 用 类 似 直 方 图 
的 形式 展示 数据 ,如 图 3-6 所 示 。 | 

图 3-6 中 ,数字 替代 了 直方 图 
中 的 长 条 , 既 保 留 了 直方 图 的 特征 ， 和 



































又 保留 了 每 个 学 生 的 原始 成 绩 信 
息 , 因 此 ,任何 人 都 很 容易 看 到 自己 
相对 于 共 他 学 生 的 成 绩 情 况 。 7 了 5 

在 学 校 中 , 一 个 班级 的 人 数 在 
40 一 60 人 之 间 ,制作 茎 叶 图 很 方便 ， 图 3-6 图 3-1 中 数据 对 应 的 莽 叶 图 
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教师 用 茎 叶 图 向 学 生 公布 成 绩 , 既 可 以 保护 学 生 的 分 数 隐私 ,又 可 
以 让 学 生 一 看 就 清楚 知道 自己 在 全 班 中 所 处 的 位 置 。 因 此 ,建议 教 
师 多 使 用 茎 时 图 。 
4. 散 点 图 
散 点 图 是 用 平面 直角 坐标 系 上 点 的 散布 图 形 来 表示 两 种 变量 
之 间 的 相关 性 与 联系 模式 。 散 点 图 适合 于 描述 二 元 变量 的 观测 数 
据 , 在 探索 变量 之 问 的 变化 规律 方面 有 独特 的 作用 。 
图 3-7 与 图 3-8 分 别 表示 的 是 初 三 (3) 班 某 次 数学 测验 的 测 
验 总 分 与 主观 题 (解答 题 )、 客 观 题 ( 选 择 题 和 填空 题 ) 得 分 情况 的 关 
系 。 由 图 3 -7 可 知 ,主观 题 得 分 高 则 测验 总 分 高 ,二 者 间 具 有 明显 
的 线性 关系 ;图 3 -8 则 表明 ,总 体 上 而 言 ,客观 题 得 分 高 则 测验 总 分 
高 ,但 是 仍 有 不 少 学 生 客观 题 得 分 高 ,但 测验 总 分 并 不 高 。 出 现 这 
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图 3-8 初 三 (3) 班 某 测 验 总 分 与 客观 题 得 分 散 点 图 
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种 情况 ,需要 结合 考生 的 具体 答卷 情况 ,再 进行 深入 分 析 。 

5. 折线 图 

折线 图 是 以 起 伏 的 折线 来 表示 数据 发 展 变化 与 演变 趋势 的 统 
计 图 ,适用 于 描述 某 种 事物 在 时 间 序 列 上 的 变化 趋势 ,也 适用 于 比 
较 不 同样 本 或 总 体 在 同一 个 研究 对 象 上 的 变化 特征 及 其 相互 联系 ， 
因此 是 常用 是 有效 的 测验 数据 展示 方法 。 

图 3-9 非常 清晰 地 展示 出 五 名 三 年 级 学 生 在 上 学 期 学 习 中 7 
次 常规 单元 测验 成 绩 之 间 的 差异 ,显然 ,在 五 名 学 生 中 ,学 生 下 的 成 
绩 比 较 稳定 ,上 而 县 分 数位 居 高 位 ;学 生 C 的 成 绩 相对 较 弱 ,波动 幅度 













































































也 较 大 ;而 成 线 波动 最 大 的 是 学 生 B, 需 要 针对 性 地 了 解 该 生 的 学 习 
习惯 与 学 习 特 长 。 
120 
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图 3-9 五 名 三 年 级 学 生 上 学 期 ?次 测验 比较 折线 图 








折线 图 提供 的 这 些 信息 对 教师 了 解 学 生 的 学 习 变 化 情况 非常 
有 用 ,能 够 指导 教师 更 好 地 落实 因材施教 ,分 类 指导 。 

三 、 统计 表 制作 的 规则 

尽管 统计 图 是 组 织 和 表示 数据 的 一 种 非常 有 用 的 工具 , 它 能 够 
迅速 地 反映 出 数据 的 分 布 与 特征 ,但 是 很 多 情况 下 ,还 需要 展示 具 


体 的 数据 。 制 作 一 个 有 用 且 容 易 阅 读 的 表格 与 作 图 一 样 重要 。 与 
制作 好 的 统计 图 一 样 ,制作 好 的 、 易 于 读 懂 的 统计 表 也 有 一 些 基 本 
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的 规则 。 艾 伦 伯 格 (1977) 确 定 了 制作 一 个 好 表格 的 六 个 基本 要 求 。 

1. 应 该 按照 测量 精度 报道 数据 

如 果 报 道 的 数字 有 小 数 部 分 ,一 般 情 况 下 保留 两 位 小 数 ,也 可 
以 根据 测量 精度 提高 或 降低 保留 位 数 的 个 数 。 例 如 ,计算 的 实际 结 
果 是 215. 324689 ,一 般 表示 为 215. 32 。 

2. 一 般 应 表示 出 行 和 列 的 均值 .和 值 

均值 、 和 值 等 概括 性 统计 量 可 以 帮助 读者 掌握 数据 的 一 般 趋势 
以 及 不 同 数据 组 之 间 的 差异 。 

3. 最 重要 的 数据 按 列 表示 

一 般 认 为 ,在 垂直 方向 上 浏览 数据 比 水 平方 向 上 浏览 数据 更 容 
易 , 为 了 更 好 地 表达 与 交流 数据 ,制作 表格 时 ,把 最 重要 的 数据 按 列 
排列 。 

4. 一 般 应 将 数据 按照 从 小 到 大 或 从 大 到 小 的 顺序 排列 

对 数据 进行 排序 后 ,读者 更 容易 发 现 数据 中 的 极 值 ,掌握 数据 
的 分 布 范围 。 

5. 行 间距 、 列 间距 适当 偏 小 

行 间 距 与 列 间距 只 要 能 够 保证 数值 清晰 即 可 。 另 外 ,数值 间 的 
距离 应 该 比较 接近 ,这 样 有 利于 对 相 邻 行 和 相 邻 列 之 间 的 数据 进行 
比较 。 

6. 只 有 在 必须 呈现 具体 数值 的 情况 下 才 使 用 表格 

由 于 数据 表 占 用 的 空间 比较 大 ,而 且 数 据 比 较 单调 、 枯 爆 ， 
此 ,只 有 必须 要 用 表格 或 没有 其 他 替代 方式 时 , 才 采 用 数据 表 。 

另外 ,表格 中 的 线条 不 宜 过 多 。 顶 线 、 底 线 , 隔 开 列 名 称 与 数字 
的 横 线 、 隔 开行 名 称 与 数字 的 纵 线 是 四 种 基本 线条 ,其 余 线 条 应 尽 
量 减 少 , 表 的 左右 两 侧 不 要 用 纵 线 封 闭 。 

































































中 王 星 详 ,Richard PRunyon 等, 行为 统计 学 基础 (第 9 版 ). 中 国人 民 大 学 出 版 
社 ,2007,134 一 135 页 。 
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、 常 用 统计 表 
根据 统计 表 结构 的 简 繁 程度 ,可 以 将 常用 统计 表 分 成 简单 表 、 
分 组 表 、 交 互 表 三 种 。 
1. 简单 表 
即 只 列 出 研究 对 象 的 名 称 , 地 点 .统计 指标 名 称 的 统计 表 , 如 表 
3-7 所 示 。 
表 3-7 初 三 年 级 各 班 学 生 人 数 














班级 | 1 班 2 班 | 3 班 4 班 | 5 班 | 合计 
人 数 45 43 46 42 47 223 
2. 分 组 表 


分 组 表 即 只 按照 一 个 标志 分 组 统计 数据 ,例如 第 二 节 中 介绍 的 
表 3-3.、3-4.3-5 都 是 只 按照 测验 成 绩 这 个 标志 将 成 线 分 成 若干 
个 组 ,对 数据 进行 统计 。 

3. 交互 表 

按照 两 个 或 两 个 以 上 标志 分 组 统计 数据 的 表格 称 为 交互 表 。 
表 3-8 是 按照 班级 ,性 别 .学 期 成 绩 等 级 等 三 个 标志 进行 分 组 的 ,这 
种 统计 表 也 称 为 三 项 表 。 


表 3-8 某 年 级 学 期 成 绩 等 级 评定 表 
ee 























优 良 中 差 
班级 合计 
男 女 男 女 男 女 男 流 
1 班 6 10 12 二 1 1 15 
一 
2 班 6 孚 11 dl 4 3 和 让 43 
3 班 8 7 10 11 4 3 2 1 46 
合计 21 20 31 34 11 10 4 3 134 
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第 四 节 测验 分 数 的 概括 


在 分 析 测 验 成 绩 时 ,用 茎 叶 图 、 频 数 分 布 表 、 频 数 分 布 直方 图 等 
初步 整理 数据 的 方法 ,对 数据 进行 列表 、 图 示 , 可 以 对 数据 的 分 布 特 
征 有 一 定 直观 而 形象 的 概要 了 解 。 但 是 ,如 果 要 对 这 些 数据 所 蕴含 
的 规律 性 做 更 进一步 的 推论 和 更 好 的 了 解 ,还 需要 计算 出 一 些 有 代 
表 性 的 数据 ,对 变量 所 蕴含 的 规律 性 做 出 更 简洁 的 数量 化 描述 ,对 
其 频数 分 布 特征 做 出 定量 刻画 。 


一 、 集 中 量 数 


描述 数据 集中 趋势 的 统计 量 称 为 集中 量 数 。 不 同 的 集中 县 数 
都 是 描述 统计 量 , 都 是 用 来 总 结 、 描 述 数 据 的 集中 情况 或 频繁 出 现 
情况 。 常 用 的 集中 恩 数 有 三 个 :平均 数 、 中 位 数 和 众 数 。 

1. 平均 数 

在 处 理 测验 卷 的 数据 时 ,人们 经 常 遇 到 的 平均 数 是 算术 平均 
数 , 它 等 于 得 分 总 和 除 以 得 分 个 数 ,用 公式 表示 如 下 : 























On a Ss se | 
A (3.1) 


nn 


其 中 ,x 表示 算术 平均 数 ,z, 表示 每 个 得 分 ,n 表示 数值 个 数 。 
平均 数 是 最 常用 的 一 个 统计 量 , 它 具有 以 下 几 个 重要 性 质 。 
(1) 平均 数 偏差 之 和 等 于 零 。 

用 公式 可 以 表示 为 














二 6G: 
gt 





也 就 是 说 ,平均 数 在 它 两 边 所 有 数值 距离 (偏差 ) 达 到 均衡 。 在 
许多 方面 ,平均 数 和 跷 跷 板 的 平衡 点 很 相似 。 
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(2) 平均 数 对 极端 值 很 敏感 。 

一 组 数据 中 ,如 果 某 个 数据 特别 小 (或 特别 大 ,那么 这 组 数据 
的 平均 数 就 会 向 这 个 特别 的 数据 靠近 ,以 求 得 均衡 。 因 此 ,平均 数 
受 组 中 数据 极端 取 值 影响 很 大 。 
(3) 平均 数 偏差 的 平方 和 最 小 。 
一 组 数据 中 ,平均 数 偏差 的 平方 和 比 其 他 任何 点 的 偏差 平方 和 
都 小 ,这 个 性 质 在 统计 学 中 经 常 遇 到 ,也 称 为 “最 小 二 乘 ”, 即 平均 数 
表示 自身 和 一 组 数据 中 数值 有 最 小 的 平均 偏差 。 

很 多 时 候 , 需 要 将 若干 组 数据 加 以 合并 ,并 计算 合并 后 的 平均 
数 ,这 种 情况 下 ,就 需要 计算 加 权 平 均 数 ,其 中 各 组 数据 的 个 数 作为 
计算 的 权重 。 

【 例 3 -5】 初 三 年 级 某 次 数学 竞赛 各 班 成 绩 如 表 3 - 9 所 不 ， 
求 该 年 级 数学 竞赛 平均 分 。 . 














表 3-9 初 三 年 级 某 次 数学 竞赛 各 班 平均 成 绩 表 











逢 5 汪 玉 大 去 二; 


45 43 46 42 
223 X83+323X ?78+323 X80 t 223 X86 223 X79 


2 81. 14。 

即 初 三 年 级 数学 竞赛 平均 分 为 81. 14。 

平均 数 具 有 反应 灵敏 .确定 严密 、 简 明 易 解 .计算 简便 而 且 能 够 

做 进一步 代数 运算 等 优点 ,因此 使 用 非常 广泛 。 但 是 , 当 一 组 数据 

中 存在 较 多 的 极 值 ,或 数据 分 布 明显 偏 态 时 ,使 用 平均 数 容易 产生 

误导 ,应 引起 注意 。 
2. 中 位 数 
中 位 数 就 是 将 一 组 数据 分 为 两 半 的 数值 ,有 一 半 的 数值 大 于 中 
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位 数 ,有 一 半 的 数值 小 于 中 位 数 , 即 中 位 数 是 50% 的 百 分 位 点 。 
把 一 组 数据 按照 由 小 到 大 、 或 由 大 到 小 的 顺序 排列 , 设 这 组 数 


据 的 个 数 是 n, 当 nn 是 奇数 时 ,中 位 数 的 位 置 就 是 "4 即 第 二 





个 数 是 这 组 数据 的 中 位 数 ; 当 是 偶数 时 ,中 位 数 的 位 置 就 是 和 


和 十 1, 即 第 妈 和 到 十 1 个 数 是 这 组 数据 的 中 位 数 。 


注意 , 当 ” 是 偶数 时 ,中 位 数 有 两 个 。 另 外 ,也 要 注意 区 分 中 位 
数 的 位 置 与 中 位 数 , 两 者 不 同 ,不 要 混淆 。 

由 于 中 位 数 主要 中 数据 排序 后 的 位 置 决定 , 它 不 受 极端 值 的 影 
响 , 因 此 ,如 果 知 道 数 据 分 布 明显 是 偏 态 时 ,考虑 优先 使 用 中 位 数 。 
但 中 位 数 对 存在 极端 高 或 极端 低 的 数据 不 敏感 ,使 用 时 也 党 要 
注意 。 

3. 众 数 

众 数 就 是 一 组 数据 中 出 现 闫 率 最 高 的 数值 , 它 最 容易 得 介 , 囚 
为 它 是 观察 得 出 的 ,而 不 是 计算 得 到 的 。 作 为 一 个 描述 统计 层 , 众 
数 并 不 常用 ,因为 它 不 够 精确 ,信息 量 有 限 ,而 及 容易 产生 误导 。 当 
数据 的 度 民 是 采用 定 序 展 表 、 定 距 量 表 、 定 比 量 表 时 ,一般 都 采用 平 
均 数 或 由 位 数 ; 当 数据 的 度量 是 采用 定 类 疆 表 时 ,可 以 使 用 众 数 。 


二 、 差 异 量 数 


频数 分 布 中 数据 问 彼 此 差异 的 程度 称 作 数据 的 离 中 趋势 , 离 中 
趋势 反映 了 频数 分 布 的 离散 程度 。 描 述 离 中 趋势 的 统计 量 称 为 差 
异 明 数 。 最 常见 的 差异 量 数 足 : 极 差 .最 大 值 与 最 小 值 .方差 和 标 

1. 极 差 

一 组 测验 分 数 的 极 差 就 是 这 组 分 数 中 最 大 值 与 最 小 值 的 差 。 
例如 ,一 组 分 数 中 ,最 高 分 是 98 分 ,最 低 分 是 35 分 , 则 极 差 就 是 


63 分 。 
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极 差 的 计算 非常 简单 , 它 刻画 了 数据 的 波动 范围 ,很 有 意义 。 
如 果 极 差 比较 大 ,说 明 考生 的 考分 差异 较 大 ;如 果 极 差 比 较 小 , 则 说 
明 考生 的 考分 比较 集中 ; 若 再 结合 测验 平均 分 进行 对 比 ,就 能 很 容 
易 地 了 解 全 体 考生 相应 知识 技能 掌握 水 平 的 高 低 。 但 是 ,由 于 极 差 
只 考虑 了 最 高 分 与 最 低 分 ,如 果 数 据 中 存在 一 个 异常 值 ,那么 极 差 
反映 的 散布 程度 可 能 就 非常 大 ,而 去 除 这 个 异常 值 后 ,可 能 数据 分 
布 非常 集中 ,这 样 就 容易 产生 误导 。 

2. 最 大 值 与 最 小 值 

虽然 极 差 可 以 描述 一 组 测验 分 数 的 散布 程度 ,但 是 它 并 没有 只 
体 刻画 这 组 测验 分 数 的 最 大 值 与 最 小 值 。 而 在 教育 测验 中 ,特别 需 
要 关注 测验 分 数 的 极端 值 ,因此 需要 知道 测验 分 数 的 最 值 。 

在 分 析 最 大 值 与 最 小 值 时 ,特别 需要 关注 最 值 附近 的 异常 点 。 
如 果 极 差 不 大 ,最 值 附近 数据 较 多 , 则 表明 数据 分 布 比较 上 正常。 如 

果 极 益 很 大 ,而 最 值 附 近 的 数据 不 多 ,那么 需要 考虑 最 值 附近 的 这 

些 数据 产生 的 原因 。 

3. 方差 与 标准 差 

在 学 校 教育 测验 中 ,人 们 往往 把 考生 成 绩 看 成 一 个 样本 ,因此 ， 
在 分 析 分 数 分 布 的 离散 程度 时 ,研究 的 都 是 样本 方差 与 样本 标 

样本 方差 的 计算 公式 为 


















































Be = (3. 3) 


Rn 


样本 标准 差 的 计算 公式 为 









-一 Da = 


方差 与 标准 差 是 表示 一 组 数据 离散 程度 的 最 好 指标 ,其 值 越 
大 ,说 明 数 据 分 布 的 离散 程度 越 大 ;其 值 越 小 ,说 明 数据 比较 集中 ， 
离散 程度 越 小。 当然 ,如 果 一 组 数据 中 存在 极端 值 的 话 ,那么 方差 





(3.4) 
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与 标准 差 对 数据 离散 程度 的 刻画 可 能 出 现 偏差 ,这 点 需要 注意 。 
方差 往往 与 平均 数 结合 起 来 一 起 使 用 , 用 于 描述 一 组 数据 的 
全 貌 。 


三 、 分 数 分 布 的 形状 


描述 一 组 测验 分 数 分 布 的 整体 形状 时 ,经 常 使 用 的 描述 统计 量 
是 偏 度 与 峰 度 。 

1. 偏 度 

当 一 组 测验 分 数 中 的 一 端 存 在 极端 值 时 , 称 这 组 测验 分 数 的 分 
布 为 有 偏 分 布 ,那些 离 平 均 数 和 其 他 数 很 远 的 极端 值 也 称 为 异常 
点 。 如 果 异 常 点 大 于 平均 数 , 则 称 分 布 为 正 偏 ; 如 果 异 常 点 小 于 平 
均 数 , 则 称 分 布 为 负 偏 。 


a 二 从 位 数 ”平均 分 pr 


对 称 分 布 
图 3-10 各 种 分 布 中 中 位 数 .平均 分 与 偏 度 的 关系 中 


由 图 3 - 10 可 知 , 当 平均 数 大 于 中 位 数 时 ,分 布 正 偏 ! 当 平均 数 
小 于 中 位 数 时 ,分 布 负 偏 ; 当 平均 数 等 于 中 位 数 时 ,分 布 是 对 称 的 。 
因此 , 当 分 布 有 偏 时 ,最 好 不 要 用 平均 数 表示 数据 的 集中 程度 ,而 用 
中 位 数 比较 适宜 

除了 用 上 述 方法 来 判断 分 布 的 偏 度 外 ,在 统计 学 上 偏 度 的 理论 
计算 公式 如 下 : 






































(zi 一 元 3 
a 
i 
医 Se 六 了 ] 
中” 雷 新 勇 ,考试 数据 的 统计 分 析 和 解释 ,上 海 :华东 师范 大 学 出 版 社 ,2007, 44 一 
52 页 。 


100 / 数学 试卷 分 析 方法 





其 中 ,s 表示 分 布 的 偏 度 ,z; 是 分 布 中 的 数据 ,为 平均 数 。 
由 于 公式 3. 5 计算 使 用 比较 繁琐 ,因此 ,在 实际 应 用 时 ,人 们 常 
有 皮尔 还 偏 度 系 数 来 估计 分 布 偏 度 ,近似 计算 公式 如 下 : 
































,_ 3(z—M.) 


蓝 


f (3.6) 

其 中 ,全 表示 偏 度 估计 值 , 即 皮尔 逊 偏 度 系数 ;z 为 平均 数 ,M, 
是 中 位 数 ,s 是 标准 差 。 

当 $ 为 正 时 ,分 布 为 正 偏 ; 当今 等 于 零 时 ,分 布 为 对 称 的 ; 当 镶 
为 负 时 ,分 布 为 负 偏 。 在 实际 问题 中 , 当 信 值 在 土 0. 50 之 间 时 ,就 可 
以 把 分 布 看 成 是 对 称 的 。 

2. 峰 度 

峰 度 是 描述 数据 分 布 的 另 一 个 常见 的 统计 量 , 它 表 明 数 据 是 下 
集中 在 均值 附近 ,或 是 否 有 许多 极端 值 且 分 布 在 较 大 的 范围 。 

峰 度 的 理论 计算 公式 如 下 : 

D2 


下 (6 
ss BD Gi 9 
其 中 ,st 表示 分 布 的 蜂 度 ,x; 是 分 布 中 的 数据 ,zx 为 平均 数 。 
公式 3.5 与 公式 3.7 形式 很 接近 ,事实 上 , 偏 度 又 称 为 平均 数 的 
三 阶 短 , 峰 度 又 称 为 平均 数 的 四 阶 短 。 
同样 地 , 峰 度 对 极端 值 也 很 敏感 ,与 偏 度 类 似 ,人 们 也 有 计算 峰 
度 的 近似 计算 公式 : 














@ 
pg PD 
其 中 ,$' 表示 峰 度 估计 值 ,Q;、Q 分 别 表示 第 三 和 第 一 四 分 位 
数 ,P,,。、Pw 分 别 表示 90% 和 10% 分 位 数 。 
峰 度 与 偏 度 的 计算 都 可 以 用 计算 机 来 完成 ,教师 在 进行 数据 分 
析 时 不 需要 背 这 些 公式 。 


二 
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第 五 节 EXCEL 与 SPSS 软件 
应 用 实例 


从 教育 测验 中 获得 的 大 量 测验 分 数 ,经 过 分 组 、 编 表 、 作 图 等 统 
计 方 法 归纳 整理 后 ,以 直观 形象 的 方式 体现 出 分 布 特征 ;然后 用 集 
中 量 数 (平均 数 、 中 位 数 、 众 数 等 ) 表 示 测 验 分 数 的 集中 程度 ,用 差异 
最 数 ( 极 差 .方差 与 标准 差 等 ) 刻 画 测验 分 数 的 离散 程度 ;再 用 偏 度 
值 和 峰 度 值 反 映 分 数 分 布 的 形态 ,这 些 描述 性 统计 量 的 计算 .图 表 
的 绘画 都 可 以 用 EXCEL 和 SPSS 软件 来 完成 。 


一 、 对 测验 分 数 进行 初步 整理 


【 例 3-6】 以 表 3 -1 与 表 3-2 中 高 二 (2) 班 与 商 二 (1) 班 其 次 
数学 单元 测验 成 绩 为 例 , 对 两 个 班 的 测验 分 数 进行 分 组 ,并 计算 机 
应 的 频数 。 

解法 1 EXCEL 软件 , 共 分 四 步 完成 。 

第 一 步 ,将 其 个 班 数 学 单元 测验 成 绩 输入 EXCEL 工作 短 的 工 
作 表 区 内 。 

第 二 步 , 求 出 两 个 班 测验 分 数 的 最 大 值 与 最 小 值 。 

最 大 值 . 最 小 值 的 计算 采用 函数 “MAX” 与 <MIN”, 在 单元 格 D3 
中 键入 “一 MAX(C3:C98)”, 按 Enter 键 , 返 回 值 99 就 显示 在 单元 
格 D3 中 。D3 表示 的 是 两 个 班 96 名 学 生 数 学 单元 测验 成 绩 的 最 大 
值 , 如 图 3 - 11。 在 单元 格 D4 中 键入 “= MIN(C3:C98)”, 按 Enter 
键 , 返 回 值 37 就 显示 在 单元 格 D4 中 。D4 表示 的 是 两 个 班 96 名 学 
生 数 学 单元 测验 成 绩 的 最 小 值 。 

第 三 步 , 将 数据 分 组 ,确定 各 组 的 分 点 。 
根据 测验 成 绩 的 最 大 值 与 最 小 值 , 先 将 测验 分 数 确定 分 成 7 个 
组 , 即 把 37 至 99 分 划分 为 7 组 ,组 与 组 之 间 的 分 点 分 别 是 39、49、 
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为 3-11 
59、69、79、89, 并 约定 若 分 数 z 志 39, 则 xz 落 在 [30, 39] 内 ; 若 x 志 
49, 则 之 落 在 [40, 49] 内 ;……; 若 zx 守 89, 则 工 落 在 [90, 99] 内 。 
将 分 组 与 分 点 按 列 输入 到 工作 表 区 内 ,如 图 3 - 12。 


[90, 99] 





图 3-12 


第 四 步 , 统 计 两 个 班 各 分 数 段 的 频数 。 

闫 数 的 计算 采用 函数 “FREQUENCY"”。 选 定 “1 班 频数 ”单元 
格 下 的 7 个 单元 格 G3 至 G9, 单 击 “ 常 用 ”工具 栏 中 的 按钮 国 , 出 现 
“插入 函数 ”对 话 框 。 如 图 3 - 13 ,在 “选择 类 别 ” 后 的 空格 中 选中 “ 统 
计 ? 类 ,在 “选择 函数 ?栏目 下 选中 "FREQUENCY”, 然 后 单 击 “ 确 定 ” 
按钮 ,出 现 公式 选项 板 “ 函 数 参 数 " 对 话 框 ,如 图 3 - 14。 在 “Data_ 
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array” 后 的 空格 中 输入 “C3:C40”( 即 1 班 38 名 学 生 的 成 绩 ) ,在 
“Bins_array” 后 的 空格 中 输入 分 点 “F3:F8”, 按 Ctrl 十 Shift 键 的 同 
时 , 按 “ 确 定 ” 按 钮 ,返回 值 0、0、0、0、9、10、19 就 显示 在 单元 格 
G3 至 G9 中。G3 至 G9 表示 的 是 1 班 38 名 学 生 数 学 单元 测验 成 绩 
各 分 数 段 的 人 数 。 























Ed 
汪 交 入 -条 价 所 的 说 明 来 尖 沁 雪人 什么 让 



























分 组 分 点 
99 [30,39] 39 
94 37 [40,49] 49 
9 [50, 59) 59 
[60 69] 69 
[70, 79] 
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Dats-errer CIC ? 
:79:t 





Bina_errer 本 :到 





的:19 





以 一 到 大 让 数 招 拓 回 一 想 仇 据 的 损 训 分 布 
Bins_urrey EE i 设 证 对 data_wray 


计算 质 果 = 0 


0 CE 













图 3-14 
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用 类 似 的 方法 ,可 以 统计 出 2 班 58 名 学 生 数学 单元 测验 成 绩 各 
分 数 段 的 人 数 ,如 图 3 - 15 所 示 。 


{FREQUENCY (C41:C98, F3:F8)} 2 
1 DS hes = sal 0 





















































9 [30, 39] 
37 [40, 49] 49 

[50, 59] 59 

[60, 69] 69 

[70, 79] 79 

[80, 89] 389 

[90, 99] 

10: 73 v 
Rs nA-GAShootaAsheoty] ~ ei >| 
图 3-15 

解法 2 SPSS 软件 , 共 分 三 步 完 成 。 
第 一 步 ,将 两 个 班 数 学 单元 测验 成 绩 导 入 SPSS 数据 编辑 器 的 
作 表 区 内 ,如 图 3 -16。 

















Rw 
Er 
图 3-16 


第 二 步 , 把 两 个 班 测验 分 数 进行 分 组 。 

如 图 3 - 17 ,首先 执行 [转换 】/ 人 [可视化 分 段 } 程 序 , 出 现 * 可 视 化 
分 段 " 对 话 框 。 在 图 3 - 18 中 ,将 左边 “变量 ”下 方 框 中 的 “成 绩 ” 导 入 
到 右边 “要 进行 分 段 的 变量 "下 的 方 框 中 。 点 击 “ 继 续 ” 按 钮 ,出 现 
“可 视 化 分 段 " 主 对 话 框 ,如 图 3 - 19。 
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计算 EC) 
四 新 纺 码 ) 


自 建 对 间 序列 虽 ) 
昔 的 缺失 值 GD) 
随机 次 种 子 GE) 





可 视 化 分 自 

[i 分量 。 划 二 “ 逆 ”后 格 进 行政 
以 下 “变量 " 列 囊 中 包 合 了 所 有 前 数字 序 小 和 刻度 变量 - 
变量 (fp) 要 进行 分 段 的 变量 号) 


[ZS¥3 (9 


| 


厂 材 要 接 捧 的 个 案 的 数量 限定 为 4) 『 了 
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在 “可 视 化 分 段 " 主 对 话 框 右边 “已 扫描 的 变量 列表 ”栏目 下 选 
中 变量 “成 绩 ”, 则 右边 当前 变量 的 名 称 显示 为 “成 绩 ”。 

在 “分 段 变量 ”后 名 称 空格 中 输入 “分 组 ”, 作 为 分 组 后 变量 的 
名 称 。 

这 时 , 主 对 话 框 的 左边 显示 “已 扫描 个 案 ” 为 96,“ 缺 失 值 ”为 0， 
表示 两 个 班 共有 96 名 学 生 , 全 部 成 绩 均 有 效 ;右边 中 上 部 “最 小 值 ” 

显示 为 37,“ 最 大 值 ”显示 为 99 ,表示 两 个 班 测 验 成 绩 的 最 低 分 为 37 
分 ,最 高 分 为 99 分 。 

在 “网 格 ” 栏 目下 方 有 两 栏 ,左边 为 (分 组 上 限 )“ 值 ”区 ,右边 为 
“标签 "( 即 分 组 的 区 间 表 示 )。 本 例 中 ,最 低 分 为 37 分 ,最 高 分 为 99 
分 , 故 将 30 一 40 分 定 为 第 一 组 , 依 此 类 推 , 每 组 组 宽 为 10 分 。 因 此 ， 
在 “ 值 " 区 下 方 第 一 行 输入 40, 第 二 行 输入 50,……。 然 后 单 击 * 生 成 
标签 ”按钮 ,软件 自动 在 “标签 ”栏目 下 生成 每 一 组 的 标识 。 

在 “上 端点 ”栏目 下 选中 “排出 ”项 ,然后 单 击 “ 确 定 ” 按 钮 。 软 件 
自动 将 数据 分 组 ,并 将 分 组 结果 保存 在 变 最 “分 组 ”中 ,如 图 3 - 20。 






































文件 四 帆 辑 引 视图 YD 数 血 久 ) 转 执 QD) 分析) 国 尼 @) 
实用 程序 W) 窗口 也 ) 帮 动 


号 到 于 对 昌 二 于 让 司 者 | S| 












图 3-20 


第 三 步 ,统计 两 个 班 测验 成 绩 各 组 的 频数 。 











如 图 3-21, 首先 执 行 [分 析 ]/【 表 ]V【[ 频 率 表 } 程 序 ,出 现 “ 频 率 
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表格 "对 话 框 ,如 图 3 - 22。 将 分 组 变量 * 分 组 "导入 右边 “频率 ”栏目 
下 的 方 框 中 ,将 "班级 "导入 右边 “ 子 组 一 一 在 每 个 表格 中 ”栏目 下 的 


方 框 中 。 








ET 二 可 LTOETTTTECECTETTTT 一 
这 报告 E) 村 
全 述 统计 下) 吉 


| 人 S|S| 加 | -上 二 地 | A | 




















1 ; 分 姐 
! 得 组 | 学 号 | 成 绩 | 分 
! 1 T 1 5 一 
2 1 2 了 
3 上 3 9 
| 1 1 4 99 

6 1 5 87 
下 6 17 
NB 1 7 99 

1 8 73 

旧 1 9 82 

加 1 10 84 

i 1 u 92 

12 1 12 85 

可 1 13 ?7 

到 1 [el 85 


! 刻 成 绠 ( 分 反 ) [分 类 








扯 才 数 检 对 gf) 
时 间 了 厚 列 了 ) 
生存 

多 二 吊 QI) 
吉 失 全 分 析 ) 
复 末 地 祥 Q) 。。 ， 


图 3-21 





图 3-22 


单 击 “ 统 计量 ”按钮 ,出 现 * 频 率 表 : 统 计量 "了 对 话 框 ,如 图 3 - 23% 














选中 “计数 ”栏目 “显示 "前 的 方 框 (表示 显示 闫 数 ); 选 中 “百分比 ” 栏 
目 | 显示 ”前 的 方 框 (表示 显示 频率 )。 单 击 “ 继 续 "按钮 ,返回 到 * 闫 
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率 表格 "。 软 件 自动 制作 频数 分 布 表 ,结果 如 表 3 - 10。 


须 证 表 : 统计 旦 








图 3-23 
单 击 图 3 - 22 中 的 “确定 ”按钮 ,软件 自动 制作 频数 分 布 表 , 结 
整理 如 表 3 - 10。 
表 3-10 高 二 年 级 1、2 班 数 学 成 绩 频数 分 布 表 


























高 二 (]) 高 二 (2) 
频数 百分比 (%》 频数 百分比 (%) 
< 一 40 0 : 1 | 
40~49 0 0 1 Wn 
0 一 59 0 0 | 6 10.3 
4 
60~69 0 0 12 20.7 
70~79 9 双亲 19 32.8 
80~89 10 26.3 12 20.7 
90 十 19 50.0 7 有 

















二 、 计算 描述 性 统计 重 


【 例 3-7】 以 表 3-1 与 表 3-2 中 高 二 (2) 班 与 高 二 (1) 班 某 次 
数学 单元 测验 成 绩 为 例 , 用 描述 性 统计 量 ( 如 平均 分 .中 位 数 、 众 数 、 
极 差 .方差 与 标准 差 . 偏 度 与 峰 度 等 ) 来 反映 两 个 班 的 测验 分 数 。 
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解法 1 用 EXCEL 软件 ,分 两 步 完 成 。 

第 一 步 ,将 两 个 班 数学 单元 测验 成 绩 输 入 EXCEL 工作 得 的 
作 表 区 内 。 

第 二 步 , 运 用 统计 函数 依次 求 出 每 个 统计 量 。 

1. 计算 平均 数 

平均 数 的 计算 采用 函数 "AVERAGE”, 如 图 3 - 24, 在 单元 格 E2 
中 键入 * 二 AVERAGE (C2:C39)”, 按 Enter 键 ,返回 值 87. 39474 就 显 
示 在 单元 格 E2 中 。E2 表示 的 是 高 二 (1) 班 38 名 学 生 数 学 单元 测验 
成 绩 的 平均 分 。 在 单元 格 F2 中 键入 “= 二 AVERAGE (C40;C97)”, 按 
Enter 键 ,返回 值 73. 87931 就 显示 在 单元 格 F2 中 。F2 表示 的 是 高 
二 (2) 班 58 名 学 生 数 学 单元 测验 成 绩 的 平均 分 。 

2， 计 算 中 位 数 

中 位 数 的 计算 采用 函数 "MEDIAN”, 其 计算 步骤 与 计算 平均 数 
类 似 。 如 图 3 - 24, 在 单元 格 E3 中 键入 “= MEDIAN(C2:C39)”, 按 
Enter 键 ,返回 值 89. 5 就 显示 在 单元 格 E3 中 。E3 表示 的 是 高 二 
《1) 班 38 名 学 生 数 学 单元 测验 成 绩 的 中 位 数 。 在 单元 格 F3 中 键入 
“一 MEDIAN(C40:C97)”, 按 Enter 键 ,返回 值 76 就 显示 在 单元 格 
F3 中 。F3 表示 的 是 高 二 (2) 班 58 名 学 生 数 学 单元 测验 成 绩 的 中 
位 数 。 

3， 计 算 众 数 

众 数 的 计算 采用 明 数 “MODE”, 其 计算 步骤 与 计算 平均 数 、 中 
位 数 类 似 ,计算 过 程 略 。 




































































4. 计算 极 差 
极 差 的 计算 有 两 种 方法 。 第 一 种 是 分 步 进行 , 先 用 函数 “MAX” 
与 “MIN” 求 出 每 个 班 分 数 的 最 大 值 与 最 小 值 ,然后 作 差 求 出 。 第 二 


种 是 综合 计算 ,如 果 比 较 熟 悉 后 ， 可 以 直接 列 出 算式 计算 ,其 计算 步 
号 与 计算 平均 数 等 类 似 。 如 图 3 - 24 ,在 单元 格 E5 沾 键入 * 二 MAX 
(C2;C39) 一 MIN(C2:C39)”, 按 Enter 键 ,返回 值 26 就 显示 在 单元 
格 E5 中 。E5 表示 的 是 高 二 (1) 班 38 名 学 生 数 学 单元 测验 成 绩 的 
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极 差 。 在 单元 格 F5 中 键入 “= MAX (C40: C97) 一 MIN (C40; 
C97)”, 按 Enter 键 ,返回 值 76 就 显示 在 单元 格 F5 中 。F5 表示 的 是 
高 二 (2) 班 58 名 学 生 数 学 单元 测验 成 绩 的 极 差 。 

5. 计算 标准 差 与 方差 

标准 差 的 计算 采用 函数 “STDEV”, 其 计算 步 又 与 计算 平均 数 、 
中 位 数 类 似 , 计算 过 程 略 。 方 差 等 于 标准 差 的 平方 ,也 很 容易 得 出 。 

6. 计算 偏 度 与 蜂 度 

偏 度 系 数 的 计算 采用 隆 数 “SKEW”, 峰 度 系数 的 计算 采用 函数 
“KURT”, 其 计算 步骤 与 计算 平均 数 、 中 位 数 类 似 , 计 算 过 程 

所 有 结果 如 图 3 - 24 所 示 。 











RT (C40:C97) 
E 

2 

1 3 Wy 攻 购 ，，- 99” 76 

4 99 ，” 极 差 267 57 

1 5 87 标准 差 “8. 228295"12. 41685 

6 77 在 近 57. 70484 154. 1782 
和 9 偏 庆 系 效 “-0. 28523” 

“ee 73 。 妖 度 系数 -1. Ne 
0: 1 9 32 入 
4 MN\ 例 3-7( 例 3-6/Sheet2/sheet3/ [Ds > 


图 3-24 

解法 2 用 SPSS 软件 , 共 分 三 步 完成 。 

第 一 步 ,将 两 个 班 数 学 单元 测验 成 绩 输 入 SPSS 数据 编辑 器 的 
工作 表 区 内 。 

第 二 步 ,计算 各 种 描述 性 统计 基 。 

如 图 3 - 25, 执 行 [分 析 ] 人 [描述 统计 】 人 频率 程序 ,出 现 “ 闫 率 ” 
对 话 框 .如 图 3-26。 

把 左边 “成 绩 "变量 导入 到 右边 “变量 ”证 的 空 框 中 。 然 后, 单 击 
“统计 量 " 按 钮 ,出 现 * 频 率 :统计 量 ” 了 对 话 框 ,如 图 3-27。 
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文件 如 多 绩 人 视图 0D 涩 笑 和 g) 苇 换 GD ER 多 实用 程序 0D) 
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| 1 4 99 Gtr » 
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在 图 3 - 27 中 ,“ 集 中 趋势 "栏目 选中 “均值 ”“ 中 位 数 ”"“ 众 数 ”， 
“离散 程度 ”栏目 选中 * 标 准 差 *“ 方 差 "“ 全 距 >“ 最 小 值 "“ 最 大 
值 ”, 在 “分 布 " 栏 目 中 选中 “ 偏 度 ”“ 峰 度 ”。 单 击 "继续 ” 按 钮 , 回 到 
“频率 "对话 框 。 

单 击 * 确 定 ? 按 钮 ,软件 自动 计算 ,然后 给 出 结果 ,如 表 3-11。 

表 3-11 高 二 年 级 1、2 班 数学 成 绩 统计 合 表 



































总 个 数 96 偏 度 的 标准 误 .246 
均值 79. 23 峰 度 .439 
中 值 79. 50 峰 度 的 标准 误 .488 
A 数 | 76 全 中 62 

标准 差 12..768 极 小 值 37 
方差 163. 021 极 大 值 99 
偏 度 et 











统计 表 3 - 11 中 各 个 统计 量 数 值 ,也 可 以 执行 [分 析 ]A[ 描 述 统 
计 】/[ 描 述 } 程 序 , 接 下 来 的 具体 步骤 与 【分析 】 作 描述 统计 】 人 频率】 
的 类 似 ,有 兴趣 的 读者 可 以 自行 探索 。 

如 果 希 望 得 到 两 个 班 各 自 的 描述 统计 量 的 值 , 计算 方法 如 下 。 

1， 如 图 3 - 28 ,执行 [分 析 】 人 比较 均值 ] 人 均值] 程序 ,出 现 *“ 均 
值 ”对 活 杠 ,如 图 3 - 29。 
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了 Er 人 
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1 了 上 罕 规 线 持 禹 划 世 ) ， 。 音 笠 二 T 松 著 (1 F 
1 2 be 举 全 种 引 0 。。 ， 委任 1 术 于 0) 1 
习 1 3 中 相关 到) 本 对 从 二 了 办 对 他) 
= . 入 a Bae 单 因素 DYA 虽 ] 了 
S| 4 入 8 a 从 
本 . i 分 关中 上 
加 | 
i 人 
引 1 9 二 
本 1 ww 双 NaF 
加 1 u 9 生理 人 是 
4 村 SA 
可 1 3 其 闪 信 分 析 时 ) r 
这 1 人 35 ee ! 
图 3-28 
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图 3=29 
2. 把 左边 的 变量 “成 绩 ? 导 入 到 右边 * 因 变量 列表 ?下 的 空 杠 中 ， 
“班级 "导入 钊 右边“ 自 变量 刻 表 ”下 的 空 框 中 。 单 击 " 选 项 ”按钮 ,出 
现 “ 均 值 :选项 ”了 对 话 框 ,如 图 3- 30。 














图 3-30 


3. 将 左边 “统计 量 ” 栏 目下 的 “个 案 数 "“ 最 小 值 *“ 最 大 值 ”、 
“均值 “中 位 数 ”"“ 全 距 ”"“ 方 差 ”"“ 标 准 差 ”"“ 偏 度 ”“ 峰 度 ” 等 统 
计 租 导入 到 右边 “单元 格 统计 量 ” 下 的 空 框 中 。 

4. 单 击 “ 继 续 ” 按 钮 ,返回 到 “均值 ”对话 框 (图 3 - 29)。 再 单 击 
“确定 ”按钮 ,软件 自动 运行 计算 程序 ,给 出 计算 结果 。 如 表 3 - 12。 

除了 表 2 -12 中 列 出 的 数值 外 ,SPSS 软件 还 可 以 计算 其 他 的 描 
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述 统计 量 , 读 者 可 以 根据 自己 的 需要 自行 选择 。 
表 2-12 高 二 年 级 1、2 班 数学 单元 测验 成 绩 报告 表 





班级 | 人 数 | 极 小 值 | 极 大 值 | 均值 | 中 位 数 | 全 距 | 方差 | 标准 差 | 偏 度 | 峰 度 











1 | ss 73 99 |87.39| 89.50| 26 | 67.705| 8.228| 一 .285|-1.116 
vy | Sa 37 94 |73.88| 76.00 | 57 |154.178|12.417| 一 .614| .232 
总 计 | 96 37 99 |79.23| 79.50 | 62 |163.021|12.768| 一 .713| .139 






































三 、 制 作 统计 图 表 


EXCEL 和 SPSS 软件 可 以 制作 各 式 各 样 的 统计 图 表 , 下 面 以 直 
方 图 、 葵 叶 图 为 例 ,介绍 作 图 的 基本 程序 ,其 他 图 形 可 以 参照 此 方法 
进行 探索 。 
【 例 3-8】 在 例 3-6 的 基础 上 ,用 直方 图 表示 两 个 班 测验 成 
绩 的 分 数 分 布 。 
解法 1 用 EXCEL 软件 , 共 分 三 步 完成 。 

第 一 步 ,根据 分 组 情况 ,确定 每 个 组 的 组 中 值 ,并 输入 EXCEL 
工作 得 的 工作 表 区 内 。 考 虑 到 测验 分 数 是 连续 数据 , 故 组 中 值 分 别 
35、45、55、65、75、85、95 ,如 图 3 - 31。 




































































% 37 [40,49] 49 


【4 2 0 45 
各 3 9 [50.59] 59 0 6 55 
世 翅 4 99 [60, 69] 69 0 12 65 
1 5 37 [7o, 79] 79 9 19 75 
3 n [80, 89] 89 10 12 85 
汪 7 99 [90, 99] 19 站 5 
1 8 73 ~ 
HN\ 例 3-7) 例 3-6/Sheet2/Sheet3/ 1* >| 
图 3-31 


第 二 步 ,根据 频数 与 组 中 值 ,制作 条 形 图 。 
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(1) 单 击 “ 图 表 向 导 ” 按 钮 副 , 弹 出“ 图表 类 型 "对话 框 ,如 图 3 - 
32。 选 择 柱 形 图 , 单 击 “ 下 一 步 ” 按 钮 ,进入 “图 表 数 据 源 ”对 话 棋 , 如 
图 3-33。 

















其 表 隔 导 -4 乞 要 之 1 


EF-Sm >) (RD ) 








图 表 向 他 。 4 步 凶 之》 亲 表 源 效 扩 


分 点 .] 班 头 数 、2 班 频数 ”组 中 值 
各 35 


Cm EY ER 








(2) 在 "数据 区 域 ?选项 卡 中 , 单 击 “ 数 据 区 域 ? 选 项 右边 的 图 标 
车 j, 出 现 工作 表 , 用 鼠标 选中 ”1 斑 频 数 ”下 面 的 数据 ; 则 “数据 区 域 ” 
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选项 卡 下 方 呈现 条 形 统计 图 。 
单 击 “ 系 列 ”选项 卡 , 在 “系列 ”选项 卡 中 . 单 击 " 分 类 (x) 轴 标志 ” 
选项 右边 的 图 标 色 :, 出现 工作 表 , 用 鼠标 选中 “组 中 值 "下 面 的 数 
据 ;* 则 * 系 列 ?选项 卡 下 方 条 形 统计 图 的 横 轴 出 现 用 组 中 值 35、45、 
55、65、75、85、95 作为 长 条 的 标识 ,如 图 3-34。 




































39 vo 
59 
69 a 


下 | 的 
39 10 
全 mie is sos 加 19 
本 Emal 
区 0 多 村 者 = M8 1$183 条 所 | 人 


图 3-34 

(3) 设计 好 数据 引用 后 , 单 击 “ 下 一 步 " 按 钮 ,进入 “图 表 选 项 ”对 

话 框 ,如 图 3 - 35。 选 定 “标题 "选项 卡 ,在 “图 标 标题 " 栏 日 下 输入 
只 表 同 对 4 秒 细 之 3 图 表 先 天 


图 表 标题 江 ) 

?更 单 元 测验 成 于 频数 分 而 = 《1D 网 汪 天 中 委 下 涟 时 委 全 
分 类 00) 狂 ) 

分 数 


数值 o0) 攻 G) 
: 峰 数 














ED (LR 





图 3-35 


第 三 章 ”测验 成 绩 的 统计 处 理 / 117 


“高 二 (1) 班 单元 测验 成 绩 频数 分 布 ”, 在 “分 类 (X) 轴 ?栏目 下 输入 
“分 数 ”, 在 “数值 (Y) 轴 ”栏目 下 输入 “实数 ”。 依 次 选择 其 他 选项 卡 
“坐标 轴 ”“ 网 格 线 ”“ 图 例 ”“ 数 据 标志 ”“ 数 据 表 ”, 根 据 需 要 进行 
设置 。 

(4) 设置 好 图 表 的 各 个 选项 后 , 单 击 “ 下 一 步 " 按 钮 ,进入 “图 表 
位 置 ?对 话 框 ,如 图 3 - 36。 若 选择 将 图 表 “ 作 为 其 中 的 对 象 插 入 ”， 
单 击 “ 完 成 ”按钮 , 则 最 后 生成 图 3 - 37 所 示 的 图 表 。 






































人 作为 其 中 的 对 象 搬入 人) WE 


Cm KES CE 


图 3-36 








高 二 (1) 班 单元 测验 成 绩 频数 分 布 

















20 E 
总 10 F | 
加 民 4 
二 二 四 加 
3 
分 数 
图 3-37 





第 三 步 , 修 改 条 形 图 ,得 到 直方 图 。 
1. 如 图 3-38, 在 EXCEL 工作 表 中 ,用 鼠标 在 任 一 直 长 条 上 单 
,选中 长 条 。 肯 右 击 鼠 标 出 现下 拉 菜 单 。 选 中 “数据 系列 格式 ” 
,出 现 “ 数 据 系 列 格式 ”对 话 框 ,如 图 3 -39。 
2. 在 “选项 * 卡 中 将 “分 类 间距 ?设置 为 零 ,再 按 “确定 按钮。 则 
图 3- 37 就 修改 成 图 3 - 40, 即 得 到 直方 图 。 
至 于 高 二 (2) 班 单元 测验 成 绩 的 频数 分 布 直方 图 的 制作 方法 ， 
与 上 述 步 骤 一 样 ,其 过 程 略 。 图 形 见 图 3 - 3。 
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高 二 (1) 班 单元 测验 成 绩 闫 数 分 布 
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图 3-38 


数据 系列 徊 式 ” 
| 国庆， 生 标 贡 ， 讽 剖 杭 1 ， 敌 郑 标志 “系列 次 序 。 过 项 


下 得 比 例 0) 
分 着 a 臣 加 


六 


呈 全 数据 扣 分 色 


而 二 《1) 商 执 无间 答 咸 损 卫 入 分布 





图 3-39 





高 二 (1) 班 单元 测验 成 绩 频 数 分 布 

















解法 2 用 SPSS 软件 制作 直方 图 比较 简单 。 
首先 制作 两 个 班 总 测验 成 绩 的 频数 分 布 直方 
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程序 ， 


空 杠 














1. 如 图 3-41, 首 先 ,打开 例 3 -6 文件 ,执行 [图 形 ] 作 直方 图 】 
出 现 “ 直 方 图 ”对 话 框 。 
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误 蒜 条 形 图 D) 





序列 图 QU 


ED i 7 1 RDC 曲线 因 Y) 


下 方 图 ss 时 则 序列 图 0) 





图 3-41 


2， 如 图 3 - 42 ,将 左边 ”成 绩 ” 变 三 导入 到 右边 * 变 量 栏 日 下 的 
中 , 单 击 “ 确 定 ” 按 钮 ,得 到 图 3 - 43。 











图 3-42 


图 3 -43 表示 的 是 高 二 (1) .高 二 (2) 两 个 班 整体 的 频数 分 布 直 





方 图 ， 


数 分 





到 中 组 距 是 5, 共 分 为 13 个 组 。 
下 面 介绍 同时 制作 高 二 (1) 班 .高 二 (2) 班 两 个 班 测验 成 绩 的 频 
布 的 直方 图 的 方法 。 
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Mean = 79.23 
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图 3-43 高 二 (1)、 高 二 (2) 两 个 班 整体 的 频数 分 布 直方 图 


1. 如 图 3 -44, 可 以 执行 [图 形 】 人 交互 式 ] 人 [直方 图 程序 ,得 到 
“创建 直方 图 ?对话 框 ,如 图 3- 45。 
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8| 1 3 73: 5 
9 1 9 32 6 莉 田 Q) 
10| 1 10 ba § 图 @) 
me 1 pat 
me 5 
可” 中 
wl a 
司 1 生 各 5 
| 1 16 4 5 rc 
全 1 让 7 二。 时 间 库 列 昌 TD) 
图 3-44 
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指定 吉 生 | 站 方面 | 标题 | 过 项 ] 

















如 图 3 -45, 在 “指定 变量 ”选项 卡 中 ,将 左边 的 变量 “班级 "导入 


到 右边 “面板 变量 ”下 的 空 框 中 ;将 左边 的 变量 “成 绩 * 导 入 右边 x 轴 





相应 的 空 框 中 。 
如 图 3 - 46, 在 “直方 图 ”选项 卡 中 ,设置 “区 间 大 小 ”栏目 ,将 “ 





者 您 变量 直方 用 | 和 天 | 过 项 ] 
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区 





间 数 量 ” 设 置 为 20, 将 “区 间 宽 度 ” 设 置 为 5。 还 可 以 根据 需要 设置 其 
他 选项 卡 。 设 置 完毕 后 , 单 击 “ 确 定 ” 按 钮 。 软 件 运 行 后 ,得 到 图 3 - 
47, 它 表示 的 是 两 个 班 成 绩 的 频数 分 布 直方 图 的 对 比 。 需 要 注意 的 
是 ,这 里 的 分 组 ,高 二 (1) 班 高 二 (2) 班 的 数据 第 一 组 区 间 分 别 是 
[73, 78)、[37, 42) ,依次 类 推 。 因 此 ,SPSS 软件 给 出 的 频数 分 布 直 
方 图 与 EXCEL 软件 给 出 的 有 差异 ,这 一 点 ,请 读者 注意 。 


1 2 





























40 50 60 70 80 9%0 70 80 90 
成 绩 成 绩 


图 3 一 47 


【 例 3-9】 用 SPSS 软件 制作 例 3 - 6 中 两 个 班 测验 成 绩 分 数 
分 布 的 总 茎 叶 图 。 

解 : 茎 叶 图 的 制作 分 3 步 进行 。 

1 如 图 3 - 48, 执行 [分 析 】 人 描述 性 统计 ] 作 探索) 程序 ,出 现 
“探索 ”对 话 框 ,如 图 3 - 49。 

2. 在 图 3-49 中 ,将 左边 的 “成 绩 ” 变 量 导入 到 右边 “ 因 变 量 列 
表 ” 栏 目下 的 空 框 中 。 单 击 “ 图 ”选项 , 出现“ 探索 :图 ” 子 对 话 框 ,如 
图 3 - 50, 在 “描述 性 栏目 下 选中 * 苓 叶 图 ,然后 单 击 “ 继 续 " 按 钮 ， 
返回 到 图 3 - 49。 

3 单 击 “确定 ”按钮 , 即 可 得 到 茎 叶 图 。 如 图 3 - 51 所 示 。 
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文件 四 ， 畏 生 @@) 车 数 放 @) “vo ET 6 实用 程序 如 窗口 入 帮助 
slag| 可] - 四 EE pe 人 
IT 亚信 表 G) 
3 和 比较 均值 和 » 
第 规 线性 模型 C) ， 
温 合 模型 GD) 了 
相关 CC) » 
GE) 
导数 贱 性 模型 @) ， 
， 
， 
， 
， 
， 
， 
» 






















分 类 @) 
数据 降 维 @) 
尺度 分 析 他 ) 
非 参 数 检 验 如 ) 
时 间 上 序列 GD) 
生存 G) 

多 重 星 应 
上 二 失 值 分 析 中 ) 
复杂 抽 祥 L) 



















轩 3-48 


显示 
仿 两 者 都 @) 





图 3 一 49 
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成 绩 Stem-and-Leaf Plot 


Frequency Sten & Leaf 
2. 00 Extremes {=<48) 
2.00 Bs 2a 
4.00 5. 5577 
4.00 6 . 0022 
8.00 6 . 56888899 
T.00 了 2334444 
21.00 7. 555556666666777788899 
11.00 8. 00001124444 
11.00 8 ， 55555777799 
19. 00 9 . 0000111112233334444 
7.00 9 5889999 : 
Stem width: 10 
Each leaf: 1 case(s) 
图 3-51 


将 图 3 - 51 翻译 成 中 文 ,如 下 表 3 - 13。 
表 3-13 两 个 班 单元 测验 成 绩 的 总 茎 叶 图 


















































频数 司 茶 叶 
2.00 极端 值 中 (=<48) 
2.00 Ss 24 
一 
4. 00 5. 5577 
= Ss 
4.00 6. | 0022 
8. 00 6. 56888899 
本 
7.00 和 2334444 
21. 00 芝 555556666666777788899 
11. 00 8 00001124444 
11. 00 8. 55555777799 
19. 00 9. 0000111112233334444 
7.00 9. 5889999 
茎 宽 ， 10 
每 叶 代表 数据 数 ， 1 个 数据 ls 
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测验 成 绩 的 统计 分 析 





运用 推断 统计 对 整理 后 的 测验 成 绩 进 行 较 深层 次 的 比较 、 研 
不同 测验 成 绩 之 间 

















究 ,主要 包括 测验 质量 指标 的 计算 与 分 析 , 考 各 








的 分 析 与 归 因 ,班级 之 间 、 班 级 与 年 级 之 间 分 数 的 比较 与 分 析 , 测验 
成 绩 的 影响 因素 分 析 , 根 据 已 有 成 绩 预 测 重要 考试 的 结果 等 ,这 些 


























第 一 节 ”相关 分 析 














研究 内 容 使 用 的 基本 技术 与 方法 包括 相关 分 析 、 回 归 分 析 与 方差 


在 教育 测验 中 ,测验 信 度 、 效 度 、 试 题 区 分 度 等 质量 指标 都 是 经 
常 研究 的 内 容 。 测 验 信 和 度 是 指 平行 测验 中 任意 两 个 测验 间 测 验 结 
果 的 一 致 性 程度 ,通常 用 两 个 测验 结果 的 相关 系数 来 表示 。 测 验 的 
效 标 关联 效 度 是 用 测验 分 数 和 效 标 之 间 的 相关 系数 表示 测验 效 度 
的 高 低 , 效 标 就 是 检测 效 度 的 参照 标准 。 试 题 区 分 度 是 指 测 验 试题 














鉴别 考生 实际 能 力 水 平 高 低 的 量度 , 实际 操作 


验 上 所 得 的 总 分 当成 考生 的 实际 能 力 水 平 , 其 中 一 种 方法 就 是 
生 群 体 在 试题 上 的 得 分 与 测验 总 分 的 相关 系数 来 表示 试题 的 
究 试 题 间 的 关系 、 





度 。 除 了 这 些 测 验 质 量 指 标 外 ,我 们 还 需要 研 
同 测验 间 的 关系 等 ,这 些 问题 的 解决 都 需要 
分 析 。 
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讨 , 把 考生 在 整个 测 


考 


区 分 


不 











有 到 相关 性 与 相 


一 、 相 关 与 相关 系数 


1， 相关 与 相关 分 析 

在 教育 研究 实践 中 ,很 多 研究 对 象 之 间 存 在 相互 关系 但 不 能 做 
出 因果 解释 。 当 事物 间 存 在 联系 又 不 能 直接 做 出 因果 关系 解释 时 ， 
称 事物 之 间 的 联系 为 相关 。 例 如 ,一 份 数 学 单元 测验 卷 由 客观 题 和 
主观 题 两 部 分 组 成 ,考生 的 客观 题 得 分 与 主观 题 得 分 之 间 存在 一 定 
的 联系 ,因为 都 反映 出 考生 对 特定 知识 技能 的 掌握 情况 ,但 同一 考 
生 两 部 分 得 分 之 间 并 不 存在 “ 因 ” 与 “ 果 ” 的 关系 。 

用 一 些 合理 的 指标 对 相关 的 事物 的 观测 值 进行 统计 分 析 的 方 
法 称 为 相关 分 析 。 

2. 相关 系数 

衡量 两 个 或 多 个 变量 间 相 关 程 度 的 定量 化 指标 称 为 相关 系数 ， 
~ 表示 ,r 具有 以 下 五 个 基本 特点 。 

(1) 相关 系数 是 同一 个 考生 群体 参与 测验 得 出 的 两 组 实测 分 数 
间 的 数量 指标 ,或 者 是 基于 相同 基础 成 对 匹配 的 两 个 考生 群体 同一 
次 测验 实测 分 数 间 的 数量 指标 。 

《2) ~ 的 取 值 范围 为 一 1 <r < 1,r 值 的 符号 表示 变量 之 间 关系 
的 方向 。 当 -~ 之 0 时 ,变量 之 间 正 相关 ;特别 地 , 当 ~= 1 时 ,变量 之 间 
严格 正 相关 . 当 ”< 0 时 ,变量 之 间 负 相关 ;特别 地 , 当 r = 一 1 时 , 变 
量 之 间 严 格 负 相关 。r = 0 表示 变量 之 间 不 存在 相关 关系 。 

《3) |z| 值 越 大 ,表明 变量 之 间 的 关系 越 强 。 

(4) -仅仅 表示 变量 间 的 联系 程度 ,即使 |r| 值 很 大 ,也 不 能 说 明 
变量 之 间 存 在 因果 关系 。 

《5) 相关 系数 间 只 是 存在 大 小 关系 ,不 存在 倍数 关系 。 例 如 
nn 二 0. 8 的 关联 程度 仅仅 表示 比 六 = 0.4 的 关联 程度 大 ,而 不 能 说 
前 者 变量 间 关 联 程度 是 后 者 变量 间 关 联 程 度 的 2 倍 。 

3. 相关 系数 的 解释 

寻找 两 个 变量 之 间 的 相关 关系 时 ,人 们 通常 借助 散 点 图 展开 研 
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究 , 探 索 变量 间 是 否 相互 联系 ,可 能 以 什么 方式 相互 联系 ;然后 计算 
相关 系数 ,进一步 探索 变量 之 间 怎 样 的 联系 才 是 好 的 相关 ? 相关 系 
数值 达到 多 少时 ,才能 说 变量 间 的 相关 关系 显著 ? 判断 相关 系数 显 
闭 性 的 依据 ,方法 与 标准 是 什么 ? 这 些 间 题 都 是 使 用 相关 系数 时 需 
要 解决 的 问题 。 

(1) 相关 系数 的 重要 性 依赖 于 研究 目的 

“变量 之 间 怎 样 的 联系 才 是 好 的 相关 ”是 如 何 认识 相关 系数 重 
要 性 的 问题 。 相 关系 数 的 重要 性 依赖 于 研究 的 种 类 ,研究 希望 解 
决 的 问题 。 例 如 ,在 一 个 陌生 领域 探索 两 个 变量 间 的 联系 时 ,相关 
系数 值 0. 15 也 许 极其 重要 ,然而 在 教育 测验 中 用 于 判定 某 道 试题 
与 测验 总 分 的 联系 时 ,这 个 相关 系数 值 很 不 理想 .这 道 试题 应 予 
淘汰 。 

(2) 解释 相关 系数 时 需要 考虑 数据 的 背景 

在 解释 相关 系数 时 ,尤其 需要 考虑 数据 收集 的 环境 和 基于 统计 
希望 做 出 什么 决定 。 如 果 两 个 变量 相关 ,那么 这 两 个 变量 之 间 的 关 
系 可 能 有 多 种 。 对 于 教育 测验 而 言 ,可 以 结合 以 下 几 种 关系 来 解释 
相关 系数 。 

中 两 个 变量 中 ,可 能 一 个 变量 确定 了 另 一 个 变量 , 即 可 能 两 者 
之 间 含有 因果 关系 。 例 如 ,测验 总 分 与 某 道 试题 的 得 分 关系 ,如 果 
假定 测验 总 分 代表 考生 能 力 水 平 ,那么 能 力 水 平 高 的 考生 在 解答 题 
难度 较 高 的 题目 上 得 分 相应 也 高 , 即 难度 较 高 的 题目 与 测验 总 卷 的 
相关 系数 值 往往 较 高 。 

@ 两 个 变量 可 能 是 某 一 共同 因素 的 相关 效应 。 例 如 ,在 数学 测 
验 中 ,试题 与 试题 之 间 的 相关 性 往往 受到 考生 数学 能 力 的 共同 影响 。 

@ 两 个 变量 测量 了 某 种 共同 的 能 力 。 例 如 ,在 中 考 、 高 考 等 大 
规模 的 考试 中 ,一 份 数学 测验 卷 包含 的 知识 点 很 多 ,那么 有 些 试 题 
可 以 归 为 一 类 ,测量 的 是 考生 数学 中 某 一 部 分 的 能 力 。 

(3) 解释 相关 系数 时 需要 考虑 使 用 的 数据 情况 
在 解释 相关 系数 时 ,还 需要 考虑 收集 的 数据 具有 的 特征 。 由 于 
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相关 系数 的 计算 与 所 收集 的 数据 的 样本 容量 .样本 平均 数 等 都 有 密 
切 的 关系 ,因此 ,在 解释 相关 系数 时 ,需要 说 明 计 算 涉 及 的 数据 背 
景 .结果 的 适用 范围 。 

中 样本 容量 问题 。 在 解释 相关 系数 时 ,需要 确定 基于 所 选 定 的 
样本 ,其 样本 容量 的 大 小 足够 代表 需要 描述 的 总 体 , 这 样 基于 相关 
系数 值 所 作出 的 解释 才 具 有 说 服 力 。 需 要 注意 的 是 ,并 不 是 样本 容 
量 大 ,相关 系数 值 就 大 ; 也 不 是 样本 容量 小 ,相关 系数 值 就 小 ;关键 
是 样本 的 选取 必须 具有 典型 性 与 代表 性 。 

@ 样本 中 极端 值 的 问题 。 由 于 相关 系数 的 计算 需要 用 到 平均 
数 ,而 平均 数 受 极端 值 影响 很 大 ,因此 ,在 计算 相关 系数 前 ,应 借助 
散 点 图 观察 极端 值 的 分 布 情况 ,确定 是 否 把 极端 值 包括 在 样本 和 研 
究 中 ,以 及 如 何 解 释 极 端 值 现象 。 

@ 多 总 体 问题 。 在 计算 相关 系数 前 ,需要 仔细 研究 数据 对 的 呈 
现状 况 。 如 果 数 据点 明显 地 呈现 出 两 个 群体 ,那么 应 该 把 数据 分 成 
两 个 子 总 体 ,分 别 加 以 详细 研究 ,而 不 是 笼统 地 说 明 数 据 组 之 间 的 相 
关 性 。 

4. 决定 系数 与 非 决定 系数 

由 于 相关 系数 存在 正 、 负 两 种 符号 ,因此 ,在 统计 学 中 另 一 种 解 
释 相 关系 数 的 方法 是 把 它 的 值 加 以 平方 。 

相关 系数 的 平方 一 被 称 为 决定 系数 , 它 说 明 一 个 变量 的 方差 而 
多 少 百分比 可 以 用 另 一 个 变量 来 解释 。 如 果 两 个 变量 间 的 相关 系 
数 为 x 二 0.685, 决 定 系 数 王 = 0.469 表示 一 个 变量 方差 的 大 丝 
46. 9% 可 以 由 另 一 个 变量 来 解释 。 

相应 地 ,也 可 以 计算 1 一 x , 它 被 称 为 非 决定 系数 ,说 明 一 个 变 
量 的 方差 有 多 少 百 分 比 不 可 以 用 另 一 个 变量 来 解释 , 即 是 由 其 他 的 
未 确定 因素 导 敏 的 。 

二 、 相 关系 数 的 类 型 及 其 计算 

收集 的 数据 类 型 不 同 ,数据 的 分 布 情况 不 同 ,计算 相关 系数 时 
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选择 的 公式 也 不 同 。 表 4 - 1 根据 测量 量 表 适 用 的 不 同 将 测验 数据 
分 为 三 类 , 列 出 教育 测验 中 经 常 遇 到 的 几 种 相关 系数 类 型 。 
表 4-1 不 同类 型 的 数据 和 它们 适用 的 相关 系数 类 型 



































变量 2 
定 类 数据 定 序数 据 定 距 或 定 比 数据 
四 分 相关 x a 
定 类 数据 | 二 分 相关 m | 首 德尔 (Kendall》 和 | 总 二 到 相关 系 
谐 系数 = 
| 四 分 相关 
变 . 尔 ni 和 关 轨 
量 | 定 序数 据 | 此 德 尔 (Kendall)| 寺 康 各 (Spearman) | 二 列 相关 系数 
L 和 谐 系数 4 
下 | 皮尔 还 (Pearson) 
定 距 或 定 | 点 二 列 相关 系 | es 
Ey 积 差 相关 系 
这 :党 政史 列 相关 系数 机关 六 和 


表 中 的 点 二 列 相关 系数 、 二 列 相关 系数 .皮尔 逊 积 差 相关 系数 
等 在 第 二 章 第 四 节 试 题 区 分 度 的 计算 部 分 ,已 经 给 予 了 详细 说 明 
这 里 不 再 一 一 獒 述 。 下 面 分 别 简要 说 明 二 分 相关 、 四 分 相关 、 肯 德 
尔 和 谐 系数 与 斯 皮尔 曼 等 级 相关 系数 的 计算 。 

1. 二 分 相关 

二 分 变量 是 指 变量 只 包含 两 个 类 别 。 如 :性 别 分 为 男 与 女 , 地 . 
区 分 为 城市 与 农村 。 当 两 个 变量 都 是 二 分 变量 时 ,描述 这 两 个 变量 
之 间 的 相关 就 称 为 二 分 变量 相关 系数 x, ,也 简称 为 $ 系数 。 只 要 其 
中 有 一 个 是 真正 的 二 分 变量 (如 性 别 ) , 先 整理 出 一 个 2X2 列 联 表 ， 
如 表 4- 2, 根据 列 联 表 的 数值 ,就 可 以 计算 g 系数 。 


表 4-2 2X2 列 联 表 
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n a 2 ab 
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多 系数 的 计算 公式 如 下 : 


元 (4. 1) 
ato a tra te ra 
其 中 ,a、5、c、d 的 含义 分 别 表示 表 4 - 2 中 各 个 变量 的 统计 
[ 例 4-1】 某 小 学 为 研究 性 别 与 数学 学 习 之 间 的 关系 ,从 全 校 
随机 抽取 300 名 学 生 , 以 期 未 考试 的 数学 成 绩 85 分 (满分 100 分 ) 为 
界 进行 分 类 ,如 表 4 - 3, 求 性 别 与 数学 成 绩 间 的 相关 系数 。 


表 4-3 300 名 小 学 生 某 次 期 末 数 学 成 绩 分 布农 











85 分 以 上 ( 含 85 分 ) 85 分 以 下 | 合计 
男生 93 
女生 87 
180 















54 | aa 








66 153 















120 300 





解 : 将 表 4- 3 中 的 数据 代入 公式 4. 1 中 ,得 
93 X66—54X87 








加 0. 065。 
VIi47 xX 153 X 180 X 120 

即 该 校 性 别 与 数学 成 绩 间 的 相关 系数 为 9.065, 说 明 该 小 学 中 
性 别 的 差异 与 数学 成 绩 间 没 有 显著 的 相关 性 。 

2. 四 分 相关 六 

当 两 个 变量 都 是 服从 正 态 分 布 的 连续 变量 (变量 取 值 是 定 距 或 
定 比 数据 ,如 ,测验 成 绩 、 身 高 .体重 等 ) ,而 且 两 个 变量 都 被 人 为 地 
分 成 二 分 变量 (如 ,测验 成 绩 分 为 合格 与 不 合格 ,身高 分 为 高 与 矮 ， 


第 四 章 ”测验 成 绩 的 统计 分 析 / 131 





体重 分 为 达标 与 不 达标 等 ), 这 时 ,表示 这 两 个 变量 之 间 的 相关 , 称 
为 四 分 相关 ,其 计算 公式 为 


Ee 
+ (A 
【 例 4-2】 某 中 学 在 新 课 改 实施 过 程 研究 物理 与 数学 学 习 之 
间 的 关系 , 现 从 全 校 初 二 、 初 三 两 个 年 级 共 随 机 抽取 200 名 学 生 ,以 
学 年 期 末 考 试 的 成 绩 60 分 (满分 100 分 ) 为 界 分 为 及 格 与 不 及 格 两 
类 ,如 表 4-4, 求 物理 与 数学 成 绩 闻 的 相关 系数 。 
表 4-4 200 名 初 二 . 初 三 学 生物 理 与 数学 成 绩 分 布 表 


(4.2) 

















及 格 (数学 ) 不 及 格 (数学 ) 合计 
及 格 (物理 ) | 100 35 135 
不 及 格 (物理 ) | 25 40 65 
合 计 125 75 200 





解 : 将 表 4 -4 中 的 数据 代入 公式 4.2 中 ,得 
a | V35 X55 ) 





VIi00X40+ V35 X25 
A cos0. 31867x 
0. 54。 
即 该 中 学 学 年 期 末 物 理 与 数学 成 绩 的 相关 系数 约 为 0. 54。 
3, 肯 德尔 (Kendall) 和 谐 系 数 工 
当 两 个 变 世 的 数值 以 多 于 2 个 等 级 的 顺序 或 类 别 表示 时 ,这 
两 个 变量 之 间 的 一 敏 性 程度 称 为 肯 德 尔 和 谐 系数 。 其 计算 公式 
如 下 : 


En (4.3) 
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其 中 SS 二 多 (CR, 一 已: 表示 变量 1 的 个 数值 的 离 差 平方 和 ， 
7 表示 变量 1 的 等 级 个 数 ;& 表示 变量 2 的 类 别 个 数 。 

如 果 要 研究 6 位 任课 教师 (&= 6) 对 5 位 学 生 (n 二 5 ) 数 学 能 力 
水 平 排序 评价 的 一 致 性 程度 ,可 以 采用 公式 4. 3 进行 计算 ,这 里 不 
再 举例 。 

4. 斯 皮尔 要 (Spearman) 等 级 相关 系数 六 

当 两 个 变量 测量 得 到 的 数据 均 以 等 级 形式 呈现 ,或 者 测量 得 到 
的 数据 是 非 正 态 分 布 时 ,两 个 变量 间 的 相关 问题 使 用 斯 皮尔 曼 等 级 
相关 方法 进行 计算 ,计算 公式 如 下 : 




















六 一 1 一 一 宁 。 (4.4) 


其 中 ,D, 表示 两 个 变量 每 对 数据 的 等 级 之 差 ,im 表示 样本 容量 。 
































【 例 4-3】 某 10 名 小 学 生 参加 数学 竞赛 .单元 测验 等 的 两 次 
测验 成 绩 如 表 4 -5, 试 求 两 次 测验 间 的 相关 系数 。 
表 4-5 10 名 小 学 生 两 次 数学 单元 测验 成 绩 表 
学 号 竞赛 单元 竞赛 等 级 ”单元 等 级 | 等 级 益 D Dy? 
1 63 98 9 3 6 36 
2 92 97 车 4 | 二 2 4 
3 88 96 5 6 -1 
4 89 95 4 7.5 | —3.5 12. 25 
5 74 95 7 7.5 0 0 
6 | % 99 1 i | 一 0.5 0. 25 
7 19 97 10 4.5 5.5 30. 25 
8 74 93 7.5 9 —1.§ 2. 25 
9 92 99 | 2.5 1.5 1 1 











第 四 章 ”测验 成 绩 的 统计 分 析 / 133 


《 续 表 ) 
学 号 竞赛 单元 “| 竞赛 等 级 ”单元 等 级 | 等 级 差 D wy 








10 81 87 6 10 二 本 16 


计 55 55 0 103 


分 析 : 由 于 不 能 确定 两 次 测验 的 成 绩 是 否 服从 正 态 分 布 ,因此 
采用 斯 皮尔 曼 (Spearman) 等 级 相关 方法 进行 计算 。 
解法 1: 将 表 4- 5 中 的 两 次 测验 成 绩 由 高 到 低 进行 排序 , 遇 到 
两 个 分 数 相同 时 ,用 它们 所 占 等 级 位 置 的 平均 数 作为 它们 的 等 级 。 
6 X103 


ws i OT 
"i > 








落 









































即 这 10 名 学 生 参 加 数学 竞赛 的 成 绩 与 单元 测验 成 绩 之 间 的 等 
级 相关 系数 是 0.376<0. 5, 说 明 竞 赛 成 绩 与 单元 测验 成 绩 的 一 致 性 
程度 不 高 。 

解法 2: 本 题 如 果 用 SPSS 软件 计算 , 共 分 4 步 , 颇 为 方便 。 

1. 将 数据 导入 SPSS 数据 编辑 器 的 工作 表 中 。 

2， 如 图 4 - 1, 执行 [分 析 】 人 相关】 人 [ 双 变 量 ] 程 序 , 出 现 *“ 双 变量 
相关 ”对 话 框 。 
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3. 如 图 4-2, 将 左边 方 框 中 的 题目 竞赛 成 绩 与 单元 测验 选 入 右 
边 的 “变量 "下 的 空 框 中 。 在 “相关 系数 ”选项 下 ,选中 “Spearman”; 
在 “显著 性 检验 ”选项 下 ,选中 “ 双 侧 检验 ”选中 “标记 显著 性 


相关 ”。 














六 
[到 ] 
ET 
理 巴 
-ln | 
-| 


TEes dl tb Sem 


显著 性 检验 
个 观 岗 检验 CD 个 单 手 检 著 
所 标记 显著 性 根 关 储 ) 





图 4-2 
4. 单 击 “ 确 定 ” 按 钮 ,执行 程序 计算 。 输 出 结果 如 表 4 -6。 
表 4-6 竞赛 成 绩 与 单元 测验 成 绩 的 相关 性 

















竞赛 成 绩 单元 测验 
相关 系数 1. 000 .366 
显著 性 ( 双 侧 》 .298 
Spearman a 10 10 
E26 单元 相关 系数 .366 1.000 
测验 显著 性 ( 双 侧 ) .298 
N 10 10 





表 4-6 显示 ,样本 总 数 是 10, 竞 赛 成 绩 与 单元 测验 的 Spearman 相 
关系 数值 为 0. 366, 双 尾 检 验 的 p 值 为 0.298, 可 以 接受 零 假设 “ 竟 
赛 成 绩 与 单元 测验 无 关 ”。 

需要 注意 的 是 ,两 种 解法 得 出 的 Spearman 相关 系数 值 咯 有 出 
入 ,这 跟 计 算 时 的 精确 度 处 理 有 关 , 但 差异 值 很 小 (0.376 与 
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0. 366) ,并 不 影响 结论 的 判断 。 
三 、 相 关系 数 的 应 用 
考试 研究 中 ,相关 分 析 具 有 较 大 的 实用 价值 , 它 既 可 以 帮助 研 


究 者 对 考试 的 质量 与 效果 做 出 正确 决策 ,也 可 以 帮助 学 校 与 教师 正 
确认 识 学 生 的 掌握 情况 以 改进 教学 与 管理 。 进 行 试卷 质量 分 析 时 ， 
相关 分 析 主 要 应 用 于 两 个 方面 。 

1， 用 于 分 析 试 卷 的 整体 质量 
由 于 试卷 的 测验 信和 度 、 测 验 效 度 的 计算 都 需要 用 到 积 差 相关 系 
数 ,除了 计算 有 关 的 相关 系数 外 ,还 需要 结合 测量 学 理论 .试卷 的 答 
题 情况 进行 深入 分 析 与 判断 ,具体 详 见 第 二 章 相关 章节 。 

2. 用 于 分 析 试 题 质量 

试题 的 难度 与 区 分 度 的 计算 需要 用 到 点 二 列 相 关 、 二 列 相关 、 
积 差 相关 等 方法 ,需要 根据 每 种 计算 方法 的 适用 条 件 、 计 算 结 果 
精确 度 的 要 求 以 及 研究 的 目的 等 多 种 因素 加 以 确定 。 作 相关 分 
析 时 ,一 般 而 言 , 能 够 用 “ 积 差 法 ”计算 相关 系数 的 ,就 不 要 用 “等 
级 法 ”计算 相关 系数 ,以 免 失 掉 原 始 数 据 中 的 一 些 有 价值 的 
信息 。 

3. 注意 区 分 相关 显著 性 水 平 与 相关 密切 程度 

相关 显著 性 水 平 通 常 分 为 两 种 :有 显著 性 ( p < 0.05) 或 有 高 
度 显 著 性 (p < 0. 01 ) ,其 意义 是 由 样本 信息 推断 两 个 变量 所 属 总 
体 也 呈 相 关 的 可 能 性 有 95% 或 99%, 即 由 于 抽样 误差 的 原因 ， 
还 有 5% 或 1% 的 推断 不 准 的 可 能 性 (两 个 变量 实际 上 并 不 相 
关 )。 也 就 是 说 ,相关 显著 性 水 平 研究 的 是 两 个 变量 之 间 有 无 相 
关 的 问题 。 相 关 显 著 性 水 平 的 检验 方法 参见 一 般 的 教育 统计 学 
书籍 。 

相关 密切 程度 是 由 相关 系数 |r| 来 度量 的 ,一 般 而 言 ,1r| 越 大 ， 
表明 两 个 变量 关系 越 密切 ,相关 程度 越 高 :|r| 越 小 ,两 个 变量 相关 程 
度 越 低 。 
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第 二 节 回归 分 析 


在 教育 研究 实践 中 ,很 多 研究 对 象 之 间 存 在 着 相关 关系 ,如 , 代 
数学 习 与 几何 学 习 的 关联 ,性 别 与 数学 学 习 的 关联 等 。 相 关 分 析 反 
映 了 两 个 变量 之 间 是 否 有 关 、 互 相关 联 的 密切 程度 ,但 是 它 并 没有 
揭示 出 两 个 变量 之 间 是 如 何 相互 依存 .相互 影响 与 发 展 变化 的 。 由 
于 变量 间 的 这 种 关联 具有 不 确定 性 ,不 能 用 数学 中 的 函数 关系 来 表 
示 , 因 此 需要 借助 统计 学 中 有 关 的 理论 与 方法 做 进一步 探讨 。 在 统 
计 学 中 ,研究 变量 间 相 互 依存 变化 的 规律 ,以 便 依据 已 知 变量 值 估 
计 预 测 未 知 变量 值 的 计算 理论 与 方法 称 为 回归 分 析 。 


、 回 归 分 析 与 相关 分 析 


归 分 析 和 相关 分 析 是 研究 变量 间 非 确定 性 关系 的 两 个 重要 
工具 ,在 应 用 中 ,两 种 分 析 方 法 互相 渗透 ,相互 结合 。 
1， 回归 与 相关 的 联系 
归 与 相关 都 是 研究 变量 间 的 关联 问题 。 利 用 回归 分 析 , 可 以 
建立 两 个 变量 之 间 的 函数 关系 ,然后 借助 函数 关系 ,由 一 个 变量 值 
来 估计 、 预 测 另 一 个 变量 值 , 估 计 与 预测 的 前 提 是 两 个 变量 间 存 在 
相关 关系 。 如 果 两 个 变量 之 间 相 关 为 0, 即 两 个 变量 无 关联 ,那么 即 
使 求 出 回归 方程 ,也 不 能 由 一 个 变量 值 估计 预测 另 一 个 变量 值 , 此 
时 的 回归 无 意义 。 在 存在 相关 的 情况 下 ,两 个 变量 的 相关 程度 越 
高 ,由 一 个 变量 值 估计 预测 另 一 个 变量 值 时 ,所 得 出 的 结论 就 越 
可 靠 。 
2， 回归 与 相关 的 区 别 
本 归 与 相关 的 区 别 主 要 在 于 两 者 的 研究 角度 不 同 , 具 体 体现 在 
以 下 三 个 方面 。 
(1) 变量 关系 的 单一 性 
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相关 分 析 研 究 的 是 变量 间 是 否 存在 相互 关系 .互相 关联 的 程度 
如 何 , 两 个 变量 处 于 平等 的 地 位 ,即使 变量 间 存 在 相关 关系 ,也 可 能 
存在 多 种 关联 方式 ,不 一 定 就 是 因果 关系 。 
加 归 分 析 是 通过 建立 回归 方程 ,依据 自 变量 的 已 知 值 去 预测 因 
变量 的 未 知 值 ,因此 ,两 个 变量 的 地 位 并 不 平等 ,其 中 因 变 量 处 于 被 
解释 的 地 位 。 

(2) 变量 取 值 的 随机 性 

相关 分 析 中 ,两 个 变量 都 是 随机 变量 ,每 个 变量 的 取 值 都 具有 
随机 性 ;但 回归 分 析 中 , 因 变 量 是 随机 变量 ,但 自 变量 可 以 是 随机 
的 ,也 可 以 是 研究 者 指定 选择 的 。 例 如 ,研究 中 学 生 的 记忆 力 与 数 
学 学 习 效果 的 关系 , 想 求 出 反映 记忆 力 与 数学 学 习 效果 关系 的 回归 
方程 ,这 时 研究 者 可 以 选取 一 定数 量具 有 某 种 记忆 力 水 平 的 中 学 生 
被 试 ;这 时 , 自 变量 (中 学 生 被 试 的 记忆 力 水 平 ) 取 值 是 非 随机 的 变 
量 , 而 因 变 量 (对 应 被 试 的 数学 测验 成 绩 ) 是 随机 的 。 

(3) 变 基 研究 的 对 称 性 

在 相关 分 析 中 ,变量 x 与 变量 y 的 相关 具有 双向 对 称 性 , 即 x 
与 ? 的 相关 和 >y 与 x 的 相关 是 一 样 的 。 但 在 回归 分 析 中 ,把 zx 作为 
自 变量 ,y 作为 因 变 量 和 把 y 作为 自 变量 、z 作为 因 变 量 , 得 到 的 回 
归 方程 是 不 同 的 , 即 回归 分 析 具 有 不 对 称 性 。 


二 、 回归 分 析 的 主要 步骤 与 基本 类 型 


1. 主要 步骤 

利用 回归 分 析 方 法 研究 变量 之 间 的 关系 ,主要 分 三 步 进行 ; 构 
回归 方程 ,检验 和 评价 所 建立 的 回归 方程 的 有 效 性 ,利用 所 构建 
回归 方程 进行 估计 、 预 测 与 控制 。 
(1) 构建 回归 方程 
构建 回归 方程 是 回归 分 析 的 核心 部 分 。 根 据 测验 得 到 的 数据 ， 
先 制作 散 点 图 ,观察 变量 间 相关 方式 与 相关 程度 ;然后 选择 适当 的 
函数 关系 式 作为 回归 方程 的 模型 ,确定 自 变量 的 个 数 ;再 遵循 最 佳 
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拟 合 原则 ,估计 回归 方程 中 的 所 有 参数 。 得 出 所 有 参数 的 估计 值 
后 , 即 构建 出 变量 间 的 回归 方程 。 

(2) 检验 和 评价 所 构建 的 回归 方程 的 有 效 性 

理论 上 ,不 论 变量 间 是 否 存在 相关 关系 ,也 不 论 自 变量 个 数 、 样 
本 大 小 如 何 ,按照 第 1 步 的 思路 均 可 以 构建 出 变量 间 的 回归 方程 。 
现在 需要 检验 构建 的 回归 方程 是 否 有 用 ? 如 果 有 用 ,那么 如 何 评价 
使 用 价值 的 高 低 ? 如 果 有 效 性 低 ,是 否 可 以 修正 回归 方程 ” 可 以 从 
哪些 方面 修正 回归 方程 ? 对 这 些 问 题 的 研究 ,形成 回归 分 析 的 第 2 
部 分 。 

(3) 利用 所 构建 的 回归 方程 进行 估计 、 预 测 与 控制 

经 过 检验 确定 为 有 效 的 回归 方程 ,就 可 以 用 来 对 因 变 量 进行 
估计 、 预 测 或 控制 。 例 如 ,估计 或 预测 因 变 量 的 取 值 范围 ,估计 或 
预测 因 变 量 的 关键 取 值 ,利用 回归 方程 揭示 变量 间 的 关系 ,通过 
控制 或 调整 自 变 量 的 取 值 而 达到 控制 因 变量 变化 趋势 的 目的 ， 
等 等 。 

2， 基 本 类 型 
回归 分 析 的 基本 类 型 是 由 变量 个 数 、 变 量 类 型 .变量 之 间 的 相 
关 关系 和 选择 的 函数 类 型 决定 的 。 
(1) 一 元 回归 与 多 元 回归 
按照 回归 方程 中 涉及 自 变量 个 数 的 多 少 ,可 以 将 回归 分 析 分 成 
一 元 回归 与 多 元 回归 两 种 。 只 研究 两 个 变量 之 间 的 回归 关系 的 , 称 
为 一 元 回归 分 析 ; 研 究 2 个 或 2 个 以 上 自 变量 与 因 变 量 之 间 的 回归 
关系 的 , 则 称 为 多 元 回归 分 析 。 例 如 ,研究 小 学 毕业 数学 成 绩 对 初 
中 毕业 数学 成 绩 的 预测 功能 时 ,属于 一 元 回归 分 析 ; 研 究 试 题 考查 
的 能 力 层 次 .内 容 深度 .考查 方式 对 试题 难度 的 影响 时 ,需要 使 用 三 
元 回归 分 析 。 

(2) 线性 回归 与 曲线 回归 

按照 构建 回归 方程 选用 的 函数 模型 的 不 同 , 可 以 将 回归 分 析 分 
成 线性 回归 和 曲线 回归 两 种 类 型 。 在 实际 应 用 中 ,变量 中 的 一 部 分 
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] 线 相关 关系 可 以 通过 一 定 的 数学 变换 转化 为 线性 相关 关系 ,从 而 
利用 线性 回归 分 析 。 
回归 分 析 中 所 应 用 的 模型 多 种 多 样 ,但 以 线性 回归 模型 的 应 用 
最 为 广泛 。 在 教育 测验 中 ,最 常见 的 是 一 元 线性 回归 和 二 元 线性 回 
归 , 下面 分 别 介绍 一 元 线性 回归 和 二 元 线性 回归 的 原理 与 具体 操作 









































三 、 一 元 线性 回归 


一 元 线性 回归 分 析 是 在 排除 其 他 影响 因素 或 假定 其 他 影响 因 
素 确定 的 前 提 下 ,研究 革 一 个 因素 ( 自 变量 ) 对 另 一 个 因素 ( 因 变 量 ) 
的 影响 过 程 。 这 种 分 析 突出 抓 主要 因素 的 特点 , 带 有 理想 化 的 
成 分 。 

一 元 线性 回归 分 析 只 涉及 两 个 变量 zx 与 y ,习惯 上 , 称 》 为 因 变 
蕴 ,x 为 自 变量 。 由 于 假设 变 居 > 与 y 之 间 为 线性 关系 ,因此 ,月 
次 函数 模型 来 构建 一 元 线性 回归 方程 。 

1. 一 元 线性 回归 方程 及 其 求法 

从 一 个 具体 例子 谈 起 。 

【 例 4-4】 表 4-7 是 其 学 校 20 名 学 生 同 一 学 年 两 个 学 期 期 未 
数学 测验 成 绩 ,其 中 x 表示 上 学 期 期 未 数学 测验 成 绩 , y 表示 下 学 其 
期 末 数 学 测验 成 绩 。 试 确定 两 次 测验 成 线 的 线性 关系 ,为 下 一 届 学 
生 的 成 绩 预 测 做 准备 。 

衷 4-7 20 名 学 生 两 个 学 期 期 末 数 学 测验 成 绩 
































i 沪 6 





Z |80 60 82 72 73 80 86 90 85 78 95 72 80 75 60 62 50 65 70 90 








y i 66 80 75 69 85 90 84 93 76 93 76 78 8] 55 68 57 62 77 85 








利用 EXCEL 软件 的 作 图 功能 ,得 到 x 与 y 这 两 组 数据 的 散 点 
图 ,如 图 4-3。 这 20 个 点 大 致 分 布 在 一 条 直线 附近 ,因此 可 以 用 -一 
次 函数 y = a 十 奴 来 近似 反映 变量 z 与 y 之 间 的 关系 。 
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(1) 一 元 线性 回归 模型 
-无 线性 回归 方程 的 回归 模型 为 
一 w 士 扩 。 (4.5) 


其 中 ,y 为 因 变量 ,xz 为 自 变量 ,a、6 为 待定 系数 。 

从 图 4-3 可 以 看 到 ,可 以 作出 不 同 的 直线 ,使 得 数据 对 应 的 点 
都 在 这 些 直 线 附 近 。 也 就 是 说 a、5 的 取 值 可 以 有 不 同 的 方法 。 这 
就 涉及 选择 最 佳 方案 问题 。 

(2) 回归 方程 构建 原理 

依据 图 4-3 来 分 析 。 

如 果 点 ( zi, yi) 在 直线 y = “十 和 上 ,那么 = “十 bi,, 即 
Yi 一 4 一 b 妈 1 二 0。 即 疯 数 y 二 a 十 7 准确 地 刻画 出 zw 之 间 的 

如 果 点 (zi, yi) 不 在 直线 > 一 “十 好 上 ,那么 关 4 十 如 1, 令 
误差 = 山 一 4 一 pri ,显然 误差 e 越 小 越 好 。 为 了 消除 正 负 号 的 影 
响 , 人 人 们 用 ef 来 做 进一步 研究 。 

综合 所 有 的 这 20 个 数据 点 , 当 所 有 误差 的 平方 和 3le? = 
2 Cy; 一 4 一 如 ,最 小 时 ,可 以 求 出 参数 4a、6 的 值 ,此 时 得 到 的 直线 
是 拟 合 最 好 的 。 

这 就 是 建立 同 归 方程 的 基本 原理 。 这 种 方法 称 为 最 小 二 乘 方 
法 , 它 是 确定 回归 直线 的 最 有 力 的 工具 。 
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(3) 回归 系数 计算 公式 
根据 最 小 二 乘 方法 ,对 a、5 求 偏 导 ,可 以 得 出 关于 a、 的 二 元 
一 次 方程 组 ,进而 得 出 关于 <、2 的 计算 公式 如 下 : 














DC 
= 一 一， (4. 6) 





DD 
a = 了 一 好 。 ee 
其 中 ,x;、y; 是 成 对 的 测验 分 数 ,、y 是 相应 的 测验 成 绩 平 


均 数 。 

我 们 把 这 种 能 反映 变量 z+、y 之 间 的 最 佳 拟 合 关系 的 直线 方程 
称 为 回归 直线 方程 ,通常 记 作 3 = a 十 br, 其 中 用 3 代替 y 是 表明 
3 了 = 二 a 十 bx 仅仅 是 对 z、y 之 间 确 定 关系 的 一 种 估计 。 人 们 也 称 5 为 
回归 系数 , 它 表 示 回 归 直 线 的 斜率 ,a 是 回归 直线 在 纵 轴 上 的 截 距 。 
a、5 的 计算 可 以 用 公式 解决 ,但 是 用 EXCEL 软件 与 SPSS 软 
件 都 可 以 很 快 完成 。 

例 4-4 解 答 : 下 面 简要 介绍 用 EXCEL 软件 求 例 4- 4 中 两 次 
测验 成 绩 之 间 的 线性 回归 方程 。 

@ 将 表 4-?7 中 的 成 绩 输 入 EXCEL 工作 表 , 如 图 4-4。 
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@@ 横向 并 列 选取 两 个 单元 格 D2、E2, 用 以 输入 计算 所 得 的 待 
定 参数 <、2 的 值 。 

图 执行 [插入 ] 人 函数] 程序 ,出 现 * 插 入 函数 ?对话 框 ,如 图 4- 
5, 在 “选择 类 别 ” 后 方 框 中 选中 “统计 ”, 在 “选择 函数 ”栏目 下 选中 
“LINEST”( 即 计算 线性 回归 方程 的 参数 )。 单 击 “ 确 定 ” 按 钮 , 出现 
“函数 参数 ?对 话 框 。 
























请 铀 入 一 条 简短 的 说 明 来 狼 述 您 起 艇 什么 ， 状 后 单 击 
区 







或 过 择 奖 别 C): 统计 


LINWEST 0mown_y s, known x’ s, eonst, stets) 
返回 贱 性 辐 归 方程 的 参数 





Cs ) Cuw ] 





@ 如 图 4-6, 在 Known_y's 后 的 方 框 中 输入 “C2:C21”( 即 因 变 
其 的 取 值 ), 在 Known_x's 后 的 方 框 中 输入 “B2: B21”( 即 自 变 其 的 








= eee:en:Ts:e0:t 


[y= to.e00,me:n. 
区 = 


| 
i = {0. 8488439734939T6, 上 


Stats™ » 计 值 。 ; a 
Et A et 适 回 TB ; 如 果 拓 向 素 痊 


计算 竺 果 = 0. 846843373 





困 4-6 
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取 值 )。 在 按 住 “Shift 十 Ctrl” 键 的 同时 , 单 击 “确定 ”按钮 , 则 在 D2、 
E2 单元 格 中 分 别 显示 出 参数 a、5 的 值 ,如 图 4-7。 











图 4-7 

所 以 ,两 次 测验 成 绩 之 间 的 线性 回归 方程 为 了 二 0. 8468z 十 
12.575。 

男 外 ,也 可 以 利用 EXCEL 软件 中 的 作 图 功能 完成 回归 直线 的 
作 图 。 

@ 先 利用 图 表 向 导 完 成 散 点 图 。 

@ 双击 选中 散 点 图 ,在 散 点 上 鼠标 右 击 ,出 现 图 表 选 项 ,如 图 
4 8。 选 择 “ 添 加 趋势 线 ”, 即 可 出 现 图 4-3 所 示 的 回归 直线 。 
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2. 一 元 线性 回归 方程 的 有 效 性 检验 

根据 原始 数据 求 出 回归 方程 后 ,由 于 这 一 回归 直线 是 根据 有 限 
的 样本 信息 获得 的 , 它 是 否 反 映 出 两 个 变量 间 的 真实 联系 规律 , 需 
要 进行 检验 。 另 外 ,还 需要 检验 回归 方程 对 因 变量 的 预测 效果 。 

(1) 方差 分 析 , 判 定 回归 方程 是 否 有 效 

在 回归 分 析 中 , 因 变 量 y 与 平均 数 了 的 差异 的 偏差 平方 和 
SS, = 习 (y 一 玉 * 可 以 分 解 成 回归 平方 和 与 误差 平方 和 两 部 分 , 即 





SS, = SS, 十 SS,。 (4.8) 
其 中 SS, = 》) (9, 一 3)* 是 回归 平方 和 , 它 完全 由 自 变 量 x 所 
决定 ,反映 的 是 x 的 重要 程度 ; SS, 二 了 ) (y 一 包 )? 是 残 差 平方 和 ， 
它 反映 的 是 随机 因素 对 因 变 量 造成 的 影响 。 
可 归 方程 有 效 性 检验 的 零 假设 是 “所 求 回归 方程 无 效 ", 也 即 
归 系 数值 为 0”, 假 设 的 实质 是 由 自 变 量 决定 的 回归 方差 并 不 显 
著 大 于 残 差 方差 。 一 元 线性 回归 方差 分 析 的 总 误差 平方 和 的 自由 
度 为 n 一 1, 回 归 平方 和 的 自由 度 为 1, 残 差 平方 和 的 自由 度 为 4 一 2， 


i A SS./1 a a 入 丰 - 
统计 世 F == ss-7t% 一 3 服从 自由 度 为 (1, 2) 的 下 分 布 。 在 显 


著 性 水 平 a 确定 的 条 件 下 ,根据 回归 自由 度 1 与 残 差 自由 度 ”一 2， 
查 下 分 布 表 , 可 以 得 到 检验 临界 值 Fa, 如果 下 沁 > Fa, 则 拒绝 零 假 
设 , 说 明 有 1 一 a 的 把 握 确 定 所 求 方 程 有 效 , 可 以 实际 使 用 ;反之 , 则 
接受 零 假设 ,说 明 所 求 方程 无 效 。 

例 4-4 解 法 ( 续 1); 下 面 , 对 例 4-4 中 求 出 的 两 次 测验 成 绩 之 
间 的 线性 回归 方程 = 0. 8468z 十 12. 575 是 否 有 效 进行 检验 。 也 借 
助 EXCEL 软件 完成 。 

名 执行 [插入 ] 人 函数] 程序 ,出 现 “ 插 入 函数 对话 框 ;在 “选择 
类 别 ” 后 方 框 中 选中 “统计 ”, 在 “选择 函数 ”栏目 下 选中 “LINEST”， 
单 击 “* 确 定 ” 按 钮 ,出现 “函数 参数 对话 框 。 在 Known_y's 后 的 方 框 
中 输入 “C2; C21”, 在 Known_x's 后 的 方 框 中 输入 “B2, B21”, 在 
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Const 后 的 方 框 9 
9。 


ph 输入 “true”, 在 Stats 后 的 方 框 叶 


h 输 入 “true”。 如 





-i TRUE ; 如 果 捞 回采 数 


计算 结果 = 
有 关 谣 函 汶 也 闫 助 00 


0.848843373 


CC 


轩 4-9 








CR 


@ 在 按 住 “Shift 十 Ctrl” 键 的 同时 , 单 击 “ 确 定 ”按钮 , 则 在 单元 
格 D2:E6 区 域 中 分 别 显 示 出 10 个 统计 量 的 值 , 如 图 4 - 10, 每 个 统 


计量 的 含义 在 








@ 如 图 4-11, 取 显著 性 水 平一 0.01, 利 


回归 系数 b 数 距 = 

回归 系数 标准 误 “” 常数 标准 误 
平方 残 差 标准 差 
了 统计 量 自由 度 n-2 
回归 平方 和 残 差 平方 和 
求 和 -2384. 75813 


图 4-10 


E 单 元 格 D8:E12 区 域 中 相对 应 的 位 置 给 予 了 解释 。 


9 











函数 “FINV” 计 算 





+ 


临界 值 Foo, (1，18)。 在 单元 格 F2 中 输入 “= FINV (0.01, 1， 
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18)”, 按 Enter 键 ,返回 值 8. 285419545 就 显示 在 单元 格 F2 中 , 即 
Fo.o (1, 18) 一 8. 285419545。 

… 下 一 84.52644645 > Fuu(1，18)， 

“有 99% 的 把 握 说 两 次 测验 成 绩 之 间 存 在 线性 关系 。 















=FINYCO. 01, 1,18) 








0.846843373 12. | 


0.092110001 7.01020046 
0. 824435542 4. 691058457- 
84. 52644645 18. 

1860. 09147 396.1085301 


加 归 系数 。 南下 a 
回归 系数 标准 误 常数 标准 误 

3 zx 平方 痪 差 标准 类 
F 统 计量 自由 度 n-2 
回归 平方 和 。 。 丰 关 平方 和 
A 和 


图 4-11 


(2) 决定 系数 ,衡量 回归 方程 有 效 性 的 高 低 
可 归 分 析 中 衡量 回归 方程 有 效 性 高 低 的 指标 称 为 决定 系数 , 记 
作 R* ,其 计算 公式 为 ， 














匡 :. (4.9) 
日 公式 4. 9 知 ,R 是 回归 平方 和 在 总 偏差 平方 和 中 所 占 的 比 
例 。 经 过 推理 ,可 以 进一步 发 现 R? = 7 ， 即 在 一 元 线性 回归 中 , 决 
定 系数 R* 是 因 变量 y 与 自 变量 z 积 差 相关 系数 的 平方 。 因 此 ,可 以 
说 回归 分 析 是 相关 分 析 的 继续 与 发 展 ,回归 分 析 对 回归 方程 有 效 性 
的 检验 实质 上 是 对 变量 相关 显著 性 的 检验 。 
例 4-4 解 法 ( 续 2): 下 面 ,对 例 4-4 中 求 出 的 两 次 测验 成 绩 之 
间 的 线性 回归 方程 3 = 0. 8468z 十 12. 575 有 效 性 的 高 低 进行 检验 。 
也 借助 EXCEL 软件 完成 。 
在 图 4- 11 中 ,已 经 求 出 决定 系数 R* ~ 0. 8244, 说 明 因 变量 y 
离 差 中 由 自 变量 x 所 决定 的 部 分 占 82. 44% ,因此 ,回归 方程 有 效 程 


R: 一 
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度 高 。 
需要 特别 注意 的 是 
取决 定 系数 是 无 意义 的 。 
3. 一 元 线性 回归 分 析 的 估计 与 预测 
求 回归 方程 的 目的 主要 是 利用 回归 方程 对 因 变量 进行 估计 与 
预测 。 在 应 用 一 元 线性 回归 方程 进行 估计 与 预测 时 ,主要 有 以 下 两 
种 情况 。 
(1) 上 
对 于 自 


经 过 方差 分 析 检 验 回归 方程 无 效 后 ,再 求 








回 









































样本 回归 方程 估计 因 变 量 回归 值 $ 的 变化 范围 

变量 zx 的 一 个 确定 值 , 因 变 量 y, 仍然 是 随机 的 。 在 实际 

问题 中 ,我 们 希望 能 够 估计 在 z 确定 的 前 提 下 , 因 变 量 回归 值 9 的 

变化 范围 。 表 4 -8 给 出 了 确定 》 变化 范围 的 计算 方法 与 计算 公式 。 
表 4-8 根据 x。 确定 % 变化 范围 的 计算 方法 与 计算 公式 

大 样本 ( 正 态 分 布 , n 之 30 ) 小 样本 (z 分 布 ， 


下 限 上 限 下 限 








n< 30) 
上 限 


显著 性 
水 平 











NC— 1.64s,. 








人 十 to wun sy 





和 % 一 1.96s, 





全 十 boos sy 








= 5 





Nh + ty oran ssr 











其 中 se 一 /十 飞 (y 一 %5) 是 加 


归 直 线 的 残 差 标准 差 。 


【 例 4-5】 在 例 4-4 中 ,已 经 建立 某 校 下 学 期 期 未 数学 测验 成 
绩 对 上 学 期 期 未 数 学 测验 成 绩 的 一 元 线性 回归 方程 9 二 0. 8468z 十 
12. 575, 残 差 的 标准 差 约 为 4. 69, 经 检验 回归 方程 有 效 , 且 有 效 性 
高 。 假 设 学 生 甲 上 学 期 期 未 数 学 测验 成 绩 x = 80 分 , 求 该 生 下 学 其 
期 末 数学 测验 预测 成 绩 y 的 95% 正 常 范围 。 

解 : 由 于 样本 数 一 20, 是 小 样本 情况 ,因此 属于 1 分布。 

当 z= 80 时 ,$= 0. 8468 X 80 十 12.575 a 80. 32. 

df = 二 n 一 2 = 18, 0 二 0.05, 查 1 值 表 得 to.os0s, = 2.101, 则 

下 限 为 80. 32 一 2. 101 X 4.69 = 70. 47, 上 限 为 80. 32 十 2.101X 





























148 / 数学 试卷 分 析 方 法 


4.69 = 90.17。 

所 以 ,该 生 下 学 期 期 末 数 学 测验 预测 成 绩 y 的 95% 正 常 范围 为 
[70. 47, 90. 17] 。 

(2) 根据 样本 因 变 量 回归 值 $ 预测 因 变 量 真 值 y 的 置信 区 间 

利用 回归 方程 由 自 变 量 x 的 值 在 一 定 概率 意义 下 估计 出 因 
量 y 的 取 值 范围 ,这 个 估计 范围 只 考虑 了 y 值 在 回归 直线 上 下 波 
动 , 并 没有 考虑 回归 直线 本 身 的 波动 。 由 于 回归 方程 建立 在 样本 
据 上 ,不同 的 样本 构建 的 回归 方程 不 一 定 相同 ,因此 用 现 有 的 回归 
方程 计算 出 的 回归 值 , 不 一 定 就 是 因 变 量 的 真实 值 。 要 想 求 出 因 变 
量 的 真实 值 ,就 需要 用 到 样本 方程 的 误差 标准 差 , 再 根据 正 态 分 布 ， 
对 因 变 量 真 实 值 的 置信 区 间 做 出 概率 估计 。 有 兴趣 的 读者 可 以 查 
阅 有 关 的 统计 学 书籍 了 。 


四 、 多 元 线性 回归 


一 元 线性 回归 只 研究 一 个 自 变量 对 因 变 量 的 影响 过 程 ,是 回归 
分 析 中 最 简单 的 情况 。 在 实际 问题 中 ,影响 因 变 量 的 因素 往往 多 于 
1 个 ,例如 学 生 学 业 成 绩 既 受 学 生 的 智力 水 平 影 响 ,还 受 个 人 学 习 方 
法 .教师 教学 方式 等 因素 的 影响 ,这 就 需要 研究 因 变 量 与 多 个 自 变 
量 的 关系 ,研究 工具 就 是 多 元 回归 分 析 。 

多 元 线性 回归 分 析 的 原理 与 一 元 线性 回归 分 析 的 原理 相同 ,但 
在 具体 计算 上 却 复 杂 得 多 ,人 们 往往 借助 计算 机 来 完成 。 下 面 主要 
介绍 多 元 线性 回归 方程 的 建立 与 检验 。 

1. 多 元 线性 回归 方程 及 其 求法 

(1) 多 元 线性 回归 模型 与 参数 意义 

多 元 线性 回归 模型 为 


3 一 2 十 jz 十 如 rz 十 … 十 Dr (4.10) 





































































































加 ”例如 ,凌云 著 , 考 试 统计 学 ,武汉 :华中 师范 大 学 出 版 社 ,2006 年 12 月 第 2 次 
印刷 。 
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其 中 ,a 是 常数 项 ,6 ,bs，…，, b 分 别 是 自 变量 ,zz，…， zh 
的 回归 系数 ,也 简称 为 偏 回 归 系数 。a 表示 的 是 在 所 有 自 变量 都 保 
持 不 变 的 情况 下 , 因 变 量 y 的 平均 变化 率 。& 表示 的 是 在 其 他 自 变 
都 保持 不 变 的 情况 下 , 自 变 量 xz; 每 变化 一 个 单位 , 因 变 量 y 的 平 
均 变化 率 。 
(2) 多 元 线性 回归 方程 构建 原理 
建立 多 元 线性 回归 方程 同样 是 利用 最 小 二 乘 方法 ,在 使 得 回归 
估计 值 % 与 实测 值 y; 的 误差 平方 和 最 小 , 即 六 时 = 3)(y; 一 入)* 
2 (xy 一 a 一 6za 一 各 za 一 … 一 和 zx)2 取得 最 小 值 时 ,利用 求 仿 
导数 的 方法 分 别 求 出 各 个 参数 a, 总 ,， 和，…, b 的 值 。 
由 于 建立 多 元 线性 回归 方程 所 使 用 的 数据 仍然 只 能 是 样本 数 
据 , 因 此 ,所 建立 的 方程 还 是 样本 回归 方程 ,通常 记 为 


$=athrtbzr tthzrr. (4.11) 


2. 多 元 线性 回归 方程 的 有 效 性 检验 

(1) 方差 分 析 

多 元 线性 回归 方程 建立 后 ,同样 必须 经 过 统计 检验 才能 判断 它 
是 否 具有 实用 价值 ,检验 的 方法 还 是 方差 分 析 法 。 回 归 方程 有 效 性 
检验 的 零 假设 是 “所 求 回归 方程 无 效 ", 多 元 线性 回归 方差 分 析 的 总 
误差 平方 和 的 自由 度 为 一 1, 回 归 平方 和 的 自由 度 为 自 变量 的 个 数 
人, 残 差 平方 和 的 自由 度 为 np 一 4 一 1, 统 计量 下 = SS-7SS- 服 
从 自由 度 为 (4，z 一 A 一 1) 的 下 分 布 .在 显著 性 水 平 a 确 定 的 条 件 下 ， 
根据 回归 自由 度 与 残 差 自由 度 n 一 一 1, 查 下 分 布 表 ,可 以 得 到 检 
验 临界 值 Fa ,如 果 下 > Fa , 则 拒绝 零 假设 ,说 明 有 1 一 a 的 把 握 确定 
所 求 方程 有 效 ,可 以 实际 使 用 ;反之 , 则 接受 零 假设 ,说 明 所 求 方程 
无 效 。 

(2) 决定 系数 与 复 相关 系数 

多 元 线性 回归 分 析 中 衡量 回归 方程 有 效 性 高 低 的 指标 仍然 是 
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决定 系数 R* ,其 计算 公式 仍 为 R? = SS-/SS,. 另 外 ,决定 系数 尽 的 
算术 根 RR 表 示 因 变量 y 与 自 变量 z, ,zz，…， zx 之 间 的 相关 程度 , 因 
此 ,R 又 称 为 y 与 zi，z，…，zt 的 复 相关 系数 , 它 是 衡量 样本 观测 
值 与 回归 估计 值 之 间 线 性 程度 的 指标 。 

(3) 偏 回 归 系 数 显著 性 检验 

多 元 线性 回归 中 ,方程 的 显著 性 检验 是 检验 多 个 自 变量 共同 对 
因 变 量 的 影响 是 否 显著 ,即使 影响 显著 ,也 不 能 说 明 每 个 自 变 量 对 
因 变 量 都 有 显著 影响 。 因 为 影响 显著 ,只 是 说 明 方 程 中 有 1 个 或 多 
个 偏 回归 系数 不 为 0, 并 不 是 说 每 一 个 偏 回归 系数 都 不 等 于 0。 因 
此 ,还 必须 对 每 一 个 自 变 量 的 回归 系数 进行 统计 检验 ,以 确定 每 个 
自 变 量 对 因 变 量 是 否 有 影响 。 

对 每 个 偏 回归 系数 的 显著 性 检验 也 都 通过 计算 机 来 完成 。 

对 自 变 量 进行 检验 和 筛选 后 ,应 剔除 那些 对 因 变 量 没 有 影响 或 
影响 很 小 ,经 检验 未 达到 显著 性 水 平 . 不 足以 入 选 的 自 变量 ,以 达到 
简化 变量 间 关 系 结构 和 所 求 回 归 方 程 的 目的 。 因 此 ,最 终 求 得 的 多 
元 线性 回归 方程 入 选 的 自 变量 个 数 可 能 少 于 最 初 选择 的 数目 。 

利用 SPSS 软件 进行 多 元 线性 回归 分 析 的 实例 参见 例 4- 12。 



































第 三 节 方差 分 析 


在 实际 研究 中 ,人们 经 常 遇 到 需要 对 不 同学 校 的 统考 成 绩 进 行 
比较 ,看 不 同学 校 之 间 的 考试 结果 是 否 有 差异 ;或 者 ,对 同一 学 校 同 
一 个 年 级 不 同班 级 的 测验 成 绩 进行 比较 ,看 看 不 同班 级 之 间 的 考试 
结果 是 否 有 差异 。 这 类 研究 的 共同 特点 是 对 同一 个 变量 ( 某 个 测验 
成 绩 ) 的 多 个 总 体 (不 同学 校 .不 同班 级 等 ) 的 平均 值 进 行 比较 ,比较 
采用 的 方法 就 是 方差 分 析 法 (analysis of variance, 简 称 ANOVA)。 
在 第 二 节 进 行 线性 回归 方程 的 有 效 性 检验 时 ,我 们 已 经 使 用 了 方差 
分 析 法 ,下 面具 体 介绍 方差 分 析 的 基本 原理 与 简单 应 用 。 
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一 、 方 差分 析 的 基本 原理 


方差 分 析 又 称 为 变异 数 分 析 , 它 是 英国 统计 学 家 Fisher 首先 提 
的 一 种 统计 方法 ,因此 有 时 也 称 为 F 检验。 方差 分 析 的 基本 思想 是 把 
得 到 的 所 有 观测 数据 分 成 几 个 组 ,分 析 数 据 中 不 同 来 源 的 变异 对 总 体 
变异 的 贡献 大 小 ,从 而 确定 自 变 量 对 因 变 量 的 影响 是 否 显著 。 

1. 方差 分 析 的 还 辑 基 础 

从 一 个 具体 例子 谈 起 。 

【 例 4-6】 某 校 初 三 年 级 六 个 班 共 299 名 学 生 。 初 三 上 学 期 
期 末 测 验 数学 成 绩 输入 EXCEL 工作 表 后 如 图 4 -12( 满 分 150 分 )， 
请 对 初 三 年 级 该 次 测验 成 绩 进 行 分 析 与 比较 。 


























图 4-12 


由 图 4- 12 知 , 初 三 年 级 六 个 班 数 学 平均 成 绩 之 间 有 差异 ,而 每 

















个 班 内 各 个 学 生成 绩 之 间 也 有 差异 。 全 年 级 的 学 生 数 学 成 绩 之 间 
存在 很 大 差异 ,这 种 差异 可 以 大 致 分 成 两 种 来 源 : 班 与 班 之 间 的 差 
异 , 班 内 学 生成 绩 间 的 差异 ,通常 把 前 者 称 为 样本 组 间 差 异 ,把 后 者 
称 为 样本 组 内 差异 。 如 果 组 间 差 异 占 较 大 比例 , 则 认为 班 与 班 之 间 的 
教学 效果 差异 明显 ;如 果 组 内 差异 占 较 大 比例 , 则 认为 全 年 级 的 成 绩 
差异 主要 由 随机 误差 造成 , 班 与 班 之 间 的 教学 效果 差异 不 明显 。 

在 方差 分 析 中 ,以 收集 的 所 有 数据 与 总 平均 数 的 偏差 平方 和 作 
为 变异 的 统计 量 , 表 示 为 
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一 与 六 ce i (4. 12) 


其 中 ,SSg 表示 总 变异 (总 平方 和 ) ,zs 表示 每 个 数据 值 ,z, 表示 
总 平均 数 ,& 表示 数据 组 数 ,n; 表示 第 i 组 的 数据 个 数 。 
总 变异 SSg 可 以 分 解 成 组 间 变 异 ( 组 间 平 方 和 ) 与 组 内 变异 (组 
内 平方 和 ) 两 部 分 , 即 
SSg = SSan 十 SSan。 (4. 13) 





其 中 组 间 变 异 SSam 一 并 一 z,)?* 是 各 个 组 的 样本 平均 数 
与 总 平均 数 偏差 的 平方 和 ,反映 的 是 分 组 因素 的 重要 程度 ; 








组 内 差异 SSan 一 多 (z 一 亏 ) 是 每 个 组 内 各 个 数据 与 本 组 


平均 数 偏差 的 平方 和 , 它 反映 的 是 随机 因素 对 因 变 量 造成 的 影响 。 

在 方差 分 析 中 ,不 能 直接 比较 SSam 与 SSan 的 大 小 ,因为 它们 
与 数据 的 个 数 、 分 组 个 数 等 有 关 。 为 了 消除 个 数 的 影响 ,往往 求 其 方 
差 , 又 称 为 均 方 , 即 偏差 平方 和 除 以 各 自 的 自由 度 。 其 中 ,组 间 均 方 


MSam = ee ,组 内 均 方 MSan 一 入 au .研究 者 关心 的 是 组 间 均 


方 是 否 显著 地 大 于 组 内 均 方 ,因此 ,在 求 下 值 时 ,把 组 间 均 方 放 在 分 
子 上 , 即 F= 次 虹 MSwn "采取 单 侧 检验 。 如 果 下 才 1, 说 明 数 据 的 总 变异 


de ne 变异 , 认为 组 间 差 异 不 显著 ; 
如 果 正 > 1, 说 明 数据 的 总 变异 中 组 间 变 异 所 占 比 例 大 于 组 内 变异 ， 
如 果 满 足下 > F,(dfam，dfam), 则 认为 组 间 差 异 显 著 。 

2. 方差 分 析 的 基本 条 件 

应 用 方差 分 析 时 ,数据 必须 满足 三 个 基本 假定 。 

(1) 变异 的 可 分 解 性 

变异 的 可 分 解 性 是 进行 方差 分 析 依 据 的 基本 原理 , 即 要 求 数据 
的 总 变异 能 够 被 分 解 成 几 个 部 分 ,每 个 部 分 的 变异 来 源 意义 明确 , 相 
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互 独立 。 例 如 , 例 4- 6 中 的 测验 成 绩 总 变异 可 以 分 解 为 组 间 变异 和 
组 内 变异 ,回归 分 析 中 总 变异 分 解 为 回归 平方 和 与 残 差 平方 和 等 。 

(2) 总 体 服从 正 态 分 布 

进行 方差 分 析 时 ,要 求 各 个 样本 来 自 的 总 体 呈 正 态 分 布 。 在 教 
育 测验 中 ,测验 成 绩 大 多 数 满足 正 态 分 布 要 求 , 一 般 不 需要 进行 正 
态 性 检验 。 如 果 已 经 认定 样本 来 自 的 总 体 属于 非 正 态 分 布 , 就 应 该 
将 数据 进行 正 态 性 转换 ,或 采用 非 参 数 检验 法 。 

(3) 方差 齐 性 

进行 方差 分 析 时 ,要 求 各 个 样本 来 自 的 总 体 方差 相等 , 即 要 求 
方差 齐 性 ,否则 不 能 进行 方差 分 析 。 一 般 地 ,在 进行 方差 分 析 之 前 ， 
要 用 哈 特 莱 (Hartley) 最 大 下 值 法 对 样本 方差 进行 齐 性 检验 ,以 便 
确定 能 否 进行 方差 分 析 。 

二 、 单 因素 方差 分 析 

1. 实施 单 因素 方差 分 析 的 前 提 条 件 

例 4-6 中 分 析 全 年 级 数学 成 绩 时 ,只 考虑 班级 这 一 个 因素 ,我 们 
称 它 为 因素 A, 而 全 年 级 分 成 的 六 个 班 称 为 因素 A 的 6 个 水 平 , 即 6 个 
不 同 取 值 。 类 似 地 , 单 因素 方差 分 析 的 前 提 条 件 可 以 表示 成 表 4- 9。 

表 4 -9 单 因素 方差 分 析 的 前 提 条 件 















































样本 容量 。 | 平均 数 
水 平 1 Th Za 9 Tat nl EE 
水 平 2 Tr? T2229 9 Ta n2 I 
因素 A [es 
水 平 i 此 ”| 画 
一 一 人 一 由 一- 
2. 单 因素 方差 分 析 的 一 般 步骤 
(1) 建立 零 假设 


首先 ,随机 抽取 & 个 样本 ( 即 因素 A 的 个 水 平 ), 它 们 均 来 自 
具有 相同 方差 的 正 态 总 体 。 然 后 ,提出 零 假设 “ 个 总 体 的 平均 数 都 
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相等 ”, 那 





么 备 择 假设 即 “ 至 少 有 2 个 总 体 的 平均 数 不 相 等 ”。 


《2) 计算 统计 量 并 建立 方差 分 析 表 














利 








公式 4.12 与 4.13 等 ,计算 SSs 、SSgm、SSun、MSgm、 


MSsw、 下 值 ,并 填写 在 表 4 -10 中。 
表 4-10 方差 分 析 表 

































变异 来 源 | 平方 和 | 自由 度 | 均 方 (方差 ) 全 要 让 
组 间 | SSam MSan /MSan | 
组 内 | SSsan | 
总 体 | SSe | 
(3) 进行 统计 推断 
根据 表 4 -10, 如 果 下 值 达 到 0.05 显著 水 平 的 临界 值 , 则 说 明 
各 平均 数 间 差异 显著 ; 若 下 值 达到 0. 01 显著 水 平 的 临界 值 , 则 说 明 
各 平均 数 间 差 异 非常 显著 。 
例 4-6 的 解答 : 下 面 运用 SPSS 软件 中 的 单 因素 方差 分 析 , 分 
析 初 三 年 级 某 次 测验 六 个 班级 之 间 平 均 数 是 否 有 差异 ,差异 是 否 显 
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器 的 工作 表 中 。 
第 2 步 , 如 图 4 - 14, 执行 【分 析 】/ 人 [比较 均值 ]/ 作 单 因 素 
ANOVA】 程 序 , 出 现 “ 单 因素 ANOVA” 对 话 框 。 





























ET 一 TELCOETI EEC 








ETT 虽 
和 和 而 
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mm ETE 3 v， 
人 1 148 常规 线性 横 接 G) ，， 单 样本 了 检 狂 所 ) 
i 2 146 揭 合 模 到 GO) 上 散 立 样本 检验 0) 
1 3 lig 相关 人 ) 配对 样本 T 检验 外) 
i 下 1 
1 6 1 可 
下 [3 33 
i i ia5 
9 42 
a 5 1 
1 0 136 
Ww" id 
相生 i46 
让 【人 
1 过 113 


国 4-14 


第 3 步 ,如 图 4- 15, 将 左边 方 框 中 的 “sum” 选 入 右边 “ 因 变 量 列 
表 ” 栏 目下 的 方 框 中 ,将 “班级 " 选 入 右边 “因子 ”栏目 下 的 方 框 中 。 


员 单 站 杰 ANOVA 


本 变 生 列表 GD 
[本 De 





| 
口 一 生 | 
WE...| HD... | 





图 4-15 
第 4 步 , 单 击 “ 选 项 "按钮, 出现 “ 单 因素 ANOVA: 选 项 ” 子 对 话 
框 ,如 图 4-16, 在 “统计 量 " 栏 目下 选中 “描述 性 ”“ 方 差 同 质 性 检 
信 ”, 单 击 “ 继 续 ” 按 钮 返回 图 4-15。 单 击 “ 两 两 比较 ”按钮 ,出 现 “ 单 
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素 ANOVA: 两 两 比较 子 对 话 框 ,如 图 4 - 17, 在 “假定 方差 齐 性 ” 
栏目 下 选中 “LSD( 最 小 显著 性 差异 法 )”“S - N - K( 多 重 比较 q 检 
验 )" 选 项 ,在 “未 假定 方差 齐 性 ”栏目 下 选中 “Tamhane’s T2” 选 项 ， 
单 击 “ 继 续 ” 按 钮 返回 图 4 - 15。 


























单 因素 AROYA: 选项 


统计 量 

订 描 壕 性 0) 

厂 四 定 有 和 粹 机 浆果 人) 
他 方 荡 同 质 性 检验 op 
厂 Brown-Forsythe @) 
T iam 


三 均 信 图 @) 
矶 失信 

个 按 分 析 归 序 持 除 个 案 4) 
;个 按 列 了 拓 除 个 案 








单 因 未 ANOYA: 商 两 比较 


赴 定 廊 柳 开 性 
‘B15 Ws--rG) 三 Yaller-Daneen ) 








下 Bonforrent @) TT Fieyd 5 六 

CF Sia) > Tey sb "Donett ) i 
a © 六 Dean@) 和 Tae | 

TT RE FEO) [Hochberg s GT200 -7 

六 R-E-G-Y QQ) fF Gebrial (@) le x [ee 六 










“来 假定 方 基 卉 性 和 
I Tonhane’s T2 0) 厂 Dammett’s T3G) Games-Howell (A) 拉 ” Dunnatt's tw 


显著 性 水 平 @， 天 一 一 






Cs] _ | ww | 
图 4-17 


第 5 步 , 单 击 图 4 - 15 中 的 “确定 ”按钮 ,执行 单 素 方差 分 析 程 
序 。 输 出 结果 见 表 4- 11 至 表 4-16。 
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均值 的 95% 置 信 区 间 
人 数 | 均值 | 极 小 值 | 极 大 值 
下 限 上 限 
初 三 (1) 班 | 50 |136.76| 7.808 | 1.104 | 134.54 | 138.98 | 113 | 8 
初 三 (2) 班 | 49 |136. 14| 8. 322 | 1. 189 | 133.75 | 138.53 | 113 | 146 
初 三 (3) 班 | 50 | 79.10 |44. 696| 6.321 | 66.40 | 91.80 9 148 
初 三 (4) 班 | 50 | 78.52 |42.882| 6.064| 66.33 | 90.71 6 143 
初 三 (5) 班 | 50 |83.94|42.245|5.974| 71.93 | 95.95 6 144 
初 三 (6) 班 | 50 | 86. 80 |39.744 75.50 | 98.10 6 143 
总 数 | 299 |100.09|43. 243 95.17 | 105.01 | 86 148 
表 4-12 测验 成 绩 的 方 整 齐 性 检验 
Levene 统计 量 afl df2 显著 性 
43. 880 5 293 0. 000 





根据 表 4 - 12, 相 伴 概 率 0. 000 小 于 0. 05, 即 排出 零 假设 “6 个 
总 体 的 方差 全 部 相等 ”, 即 认为 6 个 班 所 属 总 体 的 方差 至 少 有 2 个 不 








相等 。 
囊 4-13 ANOVA( 单 因素 方差 分 析 ) 
一 
平方 和 af 芍 方 “| FP |[ 明基 性 
组 间 198089. 642 5 39617. 928 | 32. 320 0.000 





359154, 920 


293 


1225. 785 | 





557244. 562 


组 内 
总 数 





298 


2 








表 4 -13 为 单 因素 方差 分 析 的 结果 。 由 于 下 值 为 32. 320, 下 分 
布 的 伴随 概率 为 0. 000, 即 零 假设 “6 个 班 的 平均 成 绩 相 等 ”成 立 的 


概率 为 0. 000， 
两 个 班 不 相等 。 
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因此 ,拒绝 零 假设 ,说 明 6 个 班 的 平均 成 绩 中 至 





少 有 


表 4-14 每 两 个 班 之 间 的 两 两 多 重 比较 





95% 置 信 区 间 
下 限 | 上 限 





(DD 班级 | (由) 班级 | 均值 差 (1 一 站 | 标准 误 | 显 著 性 





初 三 (2) 班 -617 7.038 | .930 |—13.23| 14.47 





初 三 (3) 班 | 57. 660(* ) | 7. 002 | .000 43.88| 71.44 





一 | 初 三 (4) 班 | 58. 240(* ) | 7.002 | .000 44. 46| 72.02 



































(1) 班 
初 三 (5) 班 | 52.820(* ) | 7.002 | .000 | 39.04| 66.60 
初 三 (6) 班 | 49. 960( *) 36.18| 63.74 
| 初 三 CD 班 < 1 开 妈 
初 三 (3) 班 | 57. 043(C* ) 43.19| 70.89 
< 初 三 (4) 班 S| 43.77| 71.47 
初 三 (5) 班 | 52. 203C* ) 38.35| 66.05 
| 初 三 (6) 班 | 49. 343(* ) |7.038 | .000 | 35.49| 63.19 
I 初 三 (1) 班 | 一 57. 660C *) 7. 002 .000 |—71.44 一 43. 88 
LSD 初 三 (2) 班 | 一 57.043Cx )| 7.038 | .000 一 70. 89| 一 43. 19 





(3) 班 初 三 (4) 班 .580 7.002 | .934 | 一 13.20| 14.36 
初 三 (5) 班 一 4. 840 7.002 | .490 | 一 18. 62 8. 94 











二 和 | 一 7. 700 7.002 | .272 | 一 21.48 6.08 
初 三 (1) 班 | 一 58. 240( * )| 7.002 | .000 | 一 72.02| 一 44. 46 





T 
初 三 (2) 班 | 一 57. 623(* )| 7. 038 | .000 | 一 71.47| 一 43.77 





,ze | 初 三 (3) 班 一 - 580 [7 002 | .934 | 一 14.36| 13.20 
(4) 班 | 
初 三 (5) 班 | 一 5.420 |7.002 | .440 | 一 19.20| 8.36 
初 三 (6) 班 | 一 8.280 |7.002| .238 | 一 22.06| 5.50 
初 三 (1) 班 | 一 52.820(x 》 7.002 | .000 | 一 66. 60| 一 39. 04 


三 (2) 班 | 一 52. 一 66.05| 一 38. 35 
(5) 班 初 三 (2) 班 | 一 52. 203( * )| 7. 038 | .000 66.05| 一 38. 35 
初 三 (3) 班 4. 840 7.002 | .490 | 一 8.94| 18.62 
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《 续 表 ) 































































































了 95%% 置 信 区 间 
(了 D 班 级 | 《外 班级 | 均值 差 (1 一 了 ) | 标准 误 | 显著 
下 限 上 限 
一 | 初 三 (4) 班 5.420 7.002 | .440 | —8.36 19. 20 
(5) 班 | 初 三 (6) 班 | 一 2.860 |7.002 | .683 |-16.64| 10.92 
初 三 (1) 班 | 一 49.960(* )| 7. 002 | .000 | 一 63.74| 一 36. 18 
二 
LSD 初 三 (2) 班 | 一 49. 343( * )| 7.038 | .000 | 一 63. 19| 一 35. 49 
莉 王 .| asz 
三 (3) 7.700 7.002 | .272 | 一 6.08| 21.48 
VW 二 2 二 
初 三 (4) 班 8. 280 7.002 | .238 | 一 5.50| 22.06 
初 三 (5) 班 2. 860 7.002 | .683 | 一 10.92| 16.64 
初 三 (2) 班 .617 1.622 | 1.000 | 一 4.25 5. 49 
上 -十 as 2 要 
初 三 (3) 班 | 57.660(* ) | 6.417 | .000 | 37.97| 77.35 
人 二 初 三 (4) 班 | 58. 240(* ) | 6.164 | .000 | 39.33| 77.15 
初 三 (5) 班 | 52.820(* ) | 6.076 | .000 | 34.18| 71.46 
初 三 (6) 班 | 49.960(* ) | 5.728 | .000 | 32.40| 67.52 
一 -一 
初 三 (1) 班 Sg 1.622 | 1.000 | 一 5.49 4. 25 
= 
初 三 (3) 班 | 57.043(* ) | 6.432 | .000 | 37.32| 76.77 
初 三 | | 
Tmhane | (2) 班 | 规 三 (人 得 ED .000 | 38.67| 76.57 
初 三 (5) 班 | 52. 203( *) | 6. 092 | .om 33. 53| 70.88 
初 三 (6) 班 49.343(* |5.745 | .000 | 31.74| 66.95 
初 三 (1) 班 | 一 57. 660( * )| 6.417 | .000 | 一 77. 35| 一 37. 97 
初 三 (2) 班 | 57. 043(。)| 6.432 | .000 二 76.77| 一 4 站 
(3) 班 | 初 三 (4) 班 .580 8.760 | 1.000 | 一 25.71| 26.87 
初 三 (5) 班 | ”一 4. 840 | sess 本 一 30.94| 21.26 
初 三 (6) 班 | 一 7.700 |] 8.459 | .999 | 一 33.09| 17.69 
| | 
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( 续 表 ) 








(了 班级 


《站 班级 | 均值 差 (1 一 站 | 标准 误 | 显著 性 








95% 置 信 区 间 
下 限 | 上 限 








初 三 (1) 班 | 一 58. 240(* )| 6.164 | .000 | 一 77.15| 一 39. 33 





初 三 (2) 班 | 一 57. 623(* )| 6. 180 | .000 | 一 76.57| 一 38. 67 





(4) 班 


初 三 (3) 班 一 .580 8.760 | 1.000 | 一 26.87| 25.71 





初 三 (5) 班 | ”一 5. 42 





初 三 (6) 班 | 一 8. 28 


0 | 1.000 | 一 30.97 20. 13 


0 8. 269 | .997 | 一 33. 10 16. 54 





en 6.076 | .000 | 一 71.46| 一 34. 18 








初 三 (2) 班 | 一 52. 203(* )| 6. 092 | .000 | 一 70.88| 一 33. 53 




















Tamhane a 初 三 (3) 班 | 4.840 | 8.698 |1.000|-21.26| 30.94 
初 三 (4) 班 | 5.420 | 8.513 |1.000 | 一 20.13| 30.97 
初 三 (6) 班 | 一 2.860 | 8.203 | 1.000 | 一 27.48| 21.76 
初 三 (1) 班 | 一 49. 960C* )| 5.728 | .000 | 一 67.52| 一 32.40 
初 三 (2) 班 | 一 49. 343( x )| 5.745 | .000 | 一 66.95| 一 31.74 
初 三 | 初 三 (3) 班 | 7.700 |8.459 | .999 | 一 17.69| 33.09 
Co | ee 上 IE 





初 三 (4) 班 8. 280 











初 三 (5) 班 2. 860 











8. 203 | 1. 000 | 一 21. 76 27. 48 





* 在 .05 水 平 上 均值 差 显 著 。 














表 4-14 显示 的 是 六 个 班 数学 平均 成 绩 两 两 比较 的 结果 ,其 中 
上 半 部 分 是 假设 方差 齐 性 下 的 LSD 比较 法 (最 小 显著 性 差异 法 ) 多 
重 检验 结果 ,下 半 部 分 是 假设 方差 不 相等 下 的 Tamhane's 法 比较 法 
多 重 检验 结果 。 
根据 表 4 - 12 我 们 已 经 得 出 6 个 班级 的 总 体 方差 不 等 的 结论 ， 
在 这 一 前 提 下 ,主要 看 表 4- 14 下 半 部 分 的 结论 ,发现 初 三 (1) 班 、 初 
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三 (2) 班 的 平均 分 与 其 他 4 个 班 的 平均 分 有 差异 ;而 它们 之 间 的 平 
均 分 没有 差异 。 

表 4-15 进一步 给 出 了 Student - Newman -Keuls 比较 法 ( 即 q 
检验 法 ) 多 重 比较 后 的 均匀 分 组 结果 ,即将 平均 分 没有 差异 的 总 体 
分 在 同一 个 大 组 中 。 显 然 ,1 班 和 2 班 为 一 组 ,组 内 的 平均 分 无 差 
别 ;3、4、5、6 班 为 一 组 ,组 内 的 平均 分 无 差别 ;但 两 个 大 组 之 间 的 
平均 分 存在 显著 差异 。 





表 4-15 同类 子 集 






































alpha 一 . 05 的 子 集 
1 2 
78. 52 
79. 10 
83. 94 
Student — ee ~ Keuls 86. 80 
136. 14 
136. 76 
640 :930 
将 显示 同类 子 集中 的 组 均值 。 


a 将 使 用 调和 均值 样本 大 小 一 49. 831。 
b 组 大 小 不 相等 。 将 使 用 组 大 小 的 调和 均值 。 将 不 保证 I 类 错误 级 别 。 


三 、 双 因素 方差 分 析 


在 教育 测验 中 ,常常 需要 研究 两 种 因素 对 学 生 学 习 的 影响 , 例 
如 ,人 们 了 既 想 分 析 学 生 智 力 因素 对 学 习 效果 的 影响 ,也 想 知道 教学 
方法 对 学 生 学 习 效果 的 影响 。 在 这 种 情况 下 ,就 要 用 双 因 素 方差 分 
析 方 法 来 处 理 研究 资料 。 

1. 实施 双 因 素 方 差分 析 的 前 提 条 件 

双 因 素 方差 分 析 的 前 提 条 件 可 以 表示 成 表 4 - 16, 其 中 因素 A 
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分 为 上 个 水 平 (或 称 为 方案 ), 因 素 B 分 为 * 个 水 平 ( 或 称 为 方案 )。 
所 谓 “ 双 因素 ”是 指 问题 中 有 两 个 自 变量 :变量 4 与 变量 B ,研究 这 




































































两 个 变量 同时 作用 于 因 变 量 (如 :学 习 效果 )。 
表 4-16 双 因 素 方 差分 析 的 前 提 条 件 
因素 B 
水 平 1 水 平 2 必 水 平 s 
’ 平 1 | rir es ei ieee es za … |zoy ss yz 
因 | 水 平 2 [za zn es Tn | on Taso os Toa) … | za Toe, Zam 
素 
A 
水 平生 [rs Th Tl i | a 

















2， 双 因 素 方差 分 析 的 一 般 步 又 

(1) 建立 零 假 设 

在 双 因 素 方差 分 析 中 ,总 变异 SSe 被 分 解 成 四 个 部 分 : 行 间 变 
异 (SSa) 、 列 间 变 异 (SSs) .交叉 变异 (SSAs) ,误差 变异 (SSE) 共 四 部 
分 , 即 





SSg = SS4+t SSg+t SSng + SSe。 (4.14) 


因此 ,相应 的 零 假 设 包 括 以 下 三 个 部 分 : 

@ 假设 因素 A 所 有 水 平 上 的 总 体 平均 数 相等 。 即 不 存在 因素 
A 效应 。 

@ 假设 因素 B 所 有 水 平 上 的 总 体 平均 数 相等 。 即 不 存在 因素 
B 效 应 。 

图 假设 因素 A 的 总 体 平均 数 与 因素 B 的 总 体 平均 数 相 等 。 即 
不 存在 因素 A 与 B 的 交互 效应 。 

《2) 计算 统计 量 并 建立 方差 分 析 表 

计算 SSgs 、SSs、SSs、SSns、 SSs、 MSs、 MSs、 MSns 、MSs、 
下 值 , 并 填写 在 表 4-17 中。 
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表 4-17 方差 分 析 表 






































下 值 右 尾 概率 忆 

变异 来 源 | 平方 和 | 自由 度 | 正信 es 
因素 A | ss, | k-1 | Ms, |[F, = Ms,/MSs 

因素 B | ss。 | -1 | MSs» |Fs = Mss/MS: 
因素 A、B (4—1) ” 
交互 效应 | SSw | (一 D | MSw [Fw = MSw/MS: 
误差 因素 | SSs k(n 一 1) MS | 

总 计 SSs | km 一 1 | 

(3) 进行 统计 推断 


根据 表 4 -17, 如 果 下 值 达到 0.05 显著 水 平 的 临界 值 , 则 说 明 
相应 因素 的 各 平均 数 间 差异 显著 ; 若 下 值 达到 0. 01 显著 水 平 的 临 
界 值 , 则 说 明 相应 因素 的 各 平均 数 间 差 异 非常 显著 。 


第 四 节 EXCEL 与 SPSS 软件 应 用 实例 


一 、 相关 系数 计算 与 显著 性 检验 


1, 计算 解答 题 的 区 分 度 

【 例 4-7】 初 三 年 级 共有 439 人 ,测验 卷 与 例 2 -5 中 的 相同 ， 
请 分 别 利 用 EXCEL 软件 .SPSS 软件 用 相关 系数 法 计算 全 年 级 该 次 
期 末 数学 测验 的 每 道 解答 题 (第 17 一 25 题 ) 的 区 分 度 。 

分 析 : 由 于 解答 题 的 每 道 题 得 分 与 测验 总 分 都 是 连续 型 变量 ， 
近似 地 服从 正 态 分 布 , 因 此 选择 使 用 积 差 相 关 法 计算 。 

解法 1: 利用 EXCEL 软件 中 PEARSON 函数 计算 。 

将 区 分 度 放 在 第 441 行 。 共 分 两 步 进行 。 

(1) 计算 第 17 题 的 区 分 度 。 
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如 图 4-18, 在 单元 格 R441 中 键入 “二 PEARSON (CR2:R440， 
AA2:AA440)”, 表 示 计 算 考生 第 17 题 得 分 与 总 分 的 积 差 相 关系 


数 , 按 
是 第 




















Enter 键 , 返 回 值 0. 8 就 显示 在 单元 格 R441 中 。R441 表示 的 
7 题 的 区 分 度 。 


(2) 计算 第 18 一 25 题 的 区 分 度 。 
重复 第 1 步 , 即 可 依次 得 到 第 18 一 25 题 的 区 分 度 ,计算 结果 如 


18。 





x22 x23 x24 x25 sum 











Dede lO Or dm la iad Ode. 
2 ,i bt 8. 118 
总 9 ME :Ke 5 135 
4 TC ee 
| 437 9 [ 5. 12 [ 13 4 130 ed 
438 0 0 时 0 0 2， 0 0 0 29 
439 0 0 0 0 0 0 0 0 15 
用 到 区 分 度 :| 0.8 0.77.0.87 0.77 0.73 0.84 0.88 0.78 
3 nt 本 2 
图 4-18 


解法 2: 利用 SPSS 软件 ,分 三 步 进 行 。 


( 





1) 如 图 4- 19, 执 行 [分 析 】 人 相关】 人 双 变 量 】 程 序 , 出 现 “ 双 变 


量 相关 ?对 话 框 。 





ErT mo MM WO Wm 





TT 
ns vo 



































1 la wl w 
着] 到 | 到 到 [本 
| a 


lain Las Ll 07 Lag uly Liane Lit alin Nl its | em Lee: | 
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(2) 如 图 4- 20, 将 左边 方 框 中 的 题目 xl 与 总 分 sum 选 入 右边 
的 “变量 ?下 的 空 框 中 。 在 “相关 系数 "选项 下 ,选中 “Pearson”; 在 “ 显 
著 性 检验 ”选项 下 ,选中 “ 双 侧 检验 ”; 选 中 “标记 显著 性 相关 ”。 








双人 党 相关 





图 4-20 


(3) 按 “ 确 定 ” 按 钮 ,执行 程序 计算 。 输 出 结果 如 表 4 - 18。 
表 4-18 第 17 题 与 测验 总 分 的 相关 性 





















Pearson 相关 性 .791(##) 
第 17 题 显著 性 ( 双 侧 》 .000 
N 439 
Pearson 相关 性 .791(x #) 1 
总 分 显著 性 ( 双 侧 ) .000 
N 439 





“+* 在 .01 水平 ( 双 便 ) 上 显著 相关 。 
表 4-18 显示 ,样本 总 数 是 439, 第 17 题 与 总 分 的 Pearson 相关 

系数 值 为 0. 791, 意 义 水 平 为 0. 01 时 , 双 屁 检验 的 p 值 为 0.000, 可 

以 拒绝 零 假设 “第 17 题 与 总 分 无 关 ”。 

用 同样 方法 ,可 以 依次 获得 第 18 一 25 题 的 试题 区 分 度 及 其 相 

关 显 著 性 水 平 的 检验 结果 。 此 处 略 。 
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2. 计算 选择 题 与 填空 题 的 区 分 度 

【 例 4 -8】 初 三 年 级 共有 439 人 ,测验 卷 与 例 2 - 5 中 的 相同 ， 
请 利用 EXCEL 软件 用 相关 系数 法 计算 全 年 级 该 次 期 末 数学 测验 的 
每 道 选 择 题 与 填空 题 (第 1 一 16 题 ) 的 区 分 度 。 

分 析 : 因为 选择 题 与 填空 题 都 是 二 分 变量 ( 即 只 有 3 与 0 两 种 
计 分 ) ,而 测验 总 分 是 连续 变量 ,因此 选择 使 用 点 二 列 相关 法 计算 相 

解 : 将 区 分 度 放 在 第 441 行 ,以 第 1 题 的 区 分 度 计算 为 例 , 共 分 
五 步 进 行 。 

(1) 计算 第 1 题 的 答对 人 数 与 答对 率 。 

如 图 4-21, 采 用 函数 “COUNTIF”, 在 单元 格 B443 中 键入 “= 
COUNTIF(B2:B440,3)”, 其 意义 是 “如 果 单元 格 中 的 数据 等 于 3， 
则 统计 个 数 ”, 按 Enter 键 , 返 回 值 410 就 显示 在 单元 格 B443 中 。 
B443 表示 的 是 第 1 题 得 3 分 的 人 数 。 






















































点 二 列 相关 系数 








图 4-21 


在 单元 格 B444 中 键入 “一 B440/439”, 其 意义 是 “得 3 分 的 人 数 
与 总 人 数 的 比 ”, 按 Enter 键 ,返回 值 0. 93 就 显示 在 单元 格 B444 中 。 
B444 表示 的 是 第 1 题 得 3 分 的 比率 , 即 答对 率 。 

(2) 计算 第 1 题 的 答 错 人 数 与 答 错 率 。 

如 图 4- 22, 在 单元 格 B445 中 键入 “一 439 一 B443”, 其 意义 是 
“总 人 数 减 去 答对 人 数 ”, 按 Enter 键 ,返回 值 29 就 显示 在 单元 格 
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B445 中 。B445 表示 的 是 第 1 题 得 0 分 的 人 数 。 也 可 以 仿照 第 1 步 
的 方法 ,用 “二 COUNTIF(B2:B440,0)” 计 算 , 有 兴趣 的 读者 可 以 试 









































二 列 相关 系数 





4 要 分 标准 基 红 9 站 
图 4-22 


在 单元 格 B446 中 键入 “一 B445/439”, 其 意义 是 “得 0 分 的 人 数 
与 总 人 数 的 比 ”, 按 Enter 键 ,返回 值 0. 07 就 显示 在 单元 格 B446 中 。 
B446 表示 的 是 第 1 题 得 0 分 的 比率 , 即 答 错 率 。 

(3) 计算 第 1 题 的 答对 平均 数 。 

答对 平均 数 的 意义 是 答对 第 1 题 的 所 有 考生 测验 总 分 的 平 
均 分 。 

先 用 鼠标 选中 区 域 B1:AA440, 即 将 所 有 考生 的 数据 选中 ,然后 
执行 [数据 }A[ 排 序 】] 程 序 , 出现 “ 排 
序 ” 对 话 框 ,如 图 4-23。 在 “主要 关 
键 字 ” 下 空 框 中 选中 “x1”( 即 第 1 
题 ), 方 框 右边 选择 降序 , 按 “ 确 定 ” 对 
话 框 ,返回 到 EXCEL 工作 表 中 。 这 
对, 表 中 的 数据 按照 x1( 第 1 题 ) 这 列 
数据 排序 ,其 余数 据 的 次 序 相应 随 之 
重 排 。 这 时 ,“sum”( 即 总 分 ) 列 的 前 
410 个 数据 就 是 答对 第 1 题 的 所 有 考 
生 的 测验 总 分 。 
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如 图 4 - 24, 采 用 函数 “AVERAGE” 计 算 答对 第 1 题 的 所 有 考 
生 的 测验 总 分 ,在 单元 格 B447 中 键入 “= AVERAGE (AA2， 
AA411)”, 按 Enter 键 ,返回 值 96.2 就 显示 在 单元 格 B447 中 。 
B447 表示 的 是 第 1 题 答 对 平均 数 。 



























43| 答对 人 数 ”410 
444| 答对 率 0.93 


图 4-24 


同样 地 ,采用 函数 “AVERAGE” 计 算 答 错 第 1 题 的 所 有 考生 的 
测验 总 分 ,在 单元 格 B448 中 键入 “一 AVERAGE (AA412， 
AA440)”, 按 Enter 键 ,返回 值 40.1 就 显示 在 单元 格 B448 中 。 
B448 表示 的 是 第 1 题 答 错 平均 数 ,如 图 4- 25。 























SAVERAGE CAA412:AA440) 











点 二 列 相关 系数 





图 4-25 


(4) 计算 所 有 考生 总 分 的 标准 差 。 
采用 函数 “STDEV? 计 算 , 在 单元 格 B449 中 键入 “= STDEV 
(AA2:AA440)”, 按 Enter 键 , 返 回 值 42. 9 就 显示 在 单元 格 B449 
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中 。B449 表示 的 是 测验 卷 所 有 考生 总 分 的 标准 差 。 
(5) 计算 第 1 题 的 区 分 度 。 
如 图 4 - 26, 在 单元 格 B441 中 键入 “一 SQRT(B444 x B446) x 


























(B447 一 B448)/B449”, 即 公式 rw 一 和 了 pg , 按 Enter 键 , 返 


回 值 0. 33 就 显示 在 单元 格 B441 中 。B441 表示 的 是 测验 卷 第 1 题 
的 区 分 度 。 












SQRT (B444*B446)+ (Bag7 -B448) /B449 

















cilplprlriclnlililrlrT 
和 0 0 
0 0 0 
点 二 列 相关 系数 

0.93 

销 人 数 。 29 

对 平均 数 '96. 2 
平均 数 40. 1 
449 总 分 标准 差 42,9 » 

图 4-26 


二 、 回 归 方程 计算 与 有 效 性 检验 


1， 一 元 线性 回归 问题 

【 例 4-9】 用 SPSS 软件 计 
算 例 4 - 4 中 两 次 测验 成 绩 的 
元 线性 回归 方程 ,并 进行 有 效 性 

解 : 回归 方程 的 计算 分 为 四 
步 进行 。 

(1) 如 图 4 -27, 将 表 4 -7 
中 的 数据 导入 SPSS 数据 编辑 器 
的 工作 表 中 ,其 中 z 表示 上 学 期 
期 末 数 学 测验 成 绩 , > 表示 下 学 


文件 人 编 回 外 ) 视 朋 Q) 丽 括 引 ) 转 执 习 分析) 
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期 期 末 数 学 测验 成 绩 。 








(2) 如 图 4- 28, 执 行 [分 析 】 人 回归】 人 线性】 程序 ,出现 "线性 回 











归 ” 对 话 框 。 















的 线 信 计 人 C) 


两 阶 最 小 二 桶 法 C) 
最 任 度 量 Q) 
图 4-28 


(3) 如 图 4-29, 将 左边 方 框 中 的 “下 学 期 期 末 数 学 成 绩 (y)” 选 
入 右边 “ 因 变 且 ” 栏 目下 的 方 框 中 ,将 “上 学 期 期 未 数学 成 绩 (z)” 选 
入 右边 “ 自 变 量 ” 栏 目下 的 方 框 中 。 单 击 “ 统 计 且 ”按钮 ,出 现 “ 线 性 


回归 :统计 基 ” 子 对 话 框 ,如 


[lad ld 

















图 4-30。 








| LE 
图 4-29 
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绪 攻 回归 








图 4-30 


(4) 在 “线性 回归 :统计 量子 对 话 框 中 ,在 “回归 系数 ”栏目 下 选 
中 “估计 “置信 区 间 ”“ 模 型 拟 合 ”, 单 击 “ 继 续 按 钮 ,返回 图 4 - 29。 

根据 需要 ,可 以 进一步 定义 图 4 - 29 中 的 子 对 话 框 “图 ”、“ 保 
存 "" 选 项"。 本 例 选 择 系统 默认 。 最 后 , 单 击 “ 确 定 ” 按 钮 ,执行 线 
性 回归 分 析 程 序 。 输 出 结果 见 表 4 - 19 至 表 4 -21。 








表 4-19 模型 摘要 
模型 R R: 调整 的 RR 估计 的 标准 差 
1 .908(a) .824 .815 4. 691 


a 预测 变量 ;( 常 量 ), 上 学 期 期 末 数 学 成 绩 。 


表 4-20 方差 分 析 表 (b) 













平方 和 自由 度 | 均 方 (方差 ) | FF 和 值 
回归 | 1860. 091 1 1860. 091 
1 残 差 | 396. 109 22. 006 
合计 | 2256. 200 
a 预测 变量 :( 常 量 ), 上 学 期 期 末 数 学 成 绩 。 
b 因 变 量 : 下 学 期 期 末 数 学 成 绩 。 

表 4-19 中 ,第 1 列 说 明 回归 分 析 采 用 的 是 模型 1; 第 2 列 两 个 
变量 之 间 的 相关 系数 RR 值 是 0. 908 ,说 明 两 个 变量 的 相关 程度 很 高 
第 3 列 确定 系数 R* 值 是 0. 824 ,说明 常 数 和 自 变量 “上 学 期 期 末 数 


显著 性 













.000(a) 
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学 成 绩 ? 可 以 解释 因 变量 “ 下 学 期 期 末 数 学 成 绩 ? 中 的 82. 4%; 第 4 
列 调整 的 R* 值 是 0. 815; 第 5 列 估计 的 标准 差 值 为 4. 691, 表 示 的 是 
根据 回归 方程 用 自 变 量 估计 因 变 量 的 残 差 标准 差 。 

在 表 4- 20 中 ,用 方差 分 析 法 检验 回归 方程 的 有 效 性 。 由 于 下 
值 为 84. 526 ,下 分 布 的 伴随 概率 为 0.000, 即 零 假设 “回归 系数 为 0” 
成 立 的 概率 为 0. 000, 因 此 ,拒绝 零 假设 ,说 明 回 归 方程 有 效 。 即 上 、 
下 学 期 期 末 数 学 成 绩 之 间 存 在 线性 相关 关系 。 

















表 4-21 回归 系数 (a) 













B 的 95% 
性 置信 区 间 


下 限 | 上 限 
0. 090 | 一 2. 153|27. 303 


了 值 | 显著 








1:794 





9. 194 | 0. 000 | 0. 653 | 1. 040 












a ， 因 变量 :下 学 期 期 末 数 学 成 绩 。 
在 表 4-21 中 ,首先 交代 了 线性 回归 模型 是 1 ,估计 参数 包括 常 








量 a 和 回归 系数 5( 即 自 变 量 z 的 系数 )。 在 没有 进行 标准 化 处 理 
前 , 求 得 常量 a 的 估计 值 是 12. 575, 标 准 误 为 7.010; 回 归 系 数 5 的 
估计 值 是 0. 847 ,标准 误 是 0.092。 由 于 数据 属于 小 样本 ,因此 服从 t 
分 布 ,计算 常量 a 和 回归 系数 2 相应 的 上 值 分 别 为 1. 794、9. 194。 
回归 系数 5 的 伴随 概率 是 0. 000, 表 示 用 1 统计 量 检 验 零 假设 “回归 
系数 为 0” 的 概率 是 0.000, 因 此 ,拒绝 零 假设 ,同样 说 明 上 、 下 学 期 期 
末 数 学 成 绩 之 间 存 在 线性 相关 关系 。 

所 以 ,所 求 得 的 两 次 测验 成 绩 之 间 一 元 线性 回归 方程 为 》= 
0, 847z 十 12. 575, 这 个 结论 与 例 4-4 中 的 相同 。 

2， 多 元 线性 回归 问题 

【 例 4-10】 表 4-22 是 某 学 校 20 名 高 三 学 生 调 研 测 试 . 一 模 、 
二 模 的 数学 成 绩 , 以 及 高 考 数学 成 绩 ,其 中 x, 表示 调研 测试 成 绩 ,zs 
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表示 一 模 成 绩 , rs 表示 二 模 成 绩 ,y 表示 高 考 成 绩 。 试 用 SPSS 软件 
计算 四 次 测验 成 绩 的 多 元 线性 回归 方程 ,并 进行 有 效 性 检验 ,为 下 
一 届 高 三 学 生 的 高 考 成 绩 预 测 做 准备 。 

表 4-22 20 名 高 三 学 生 四 次 数学 测验 成 绩 























一 一 a Es 
序号 1 2 3 4 6 7 8 9 10 
Tl 142 | 136 | 137 | 8 98 84 133 | 104 52 342 
I 136 | 120 | 140 | 109 | 89 96 145 | 115 64 107 









































Xx | 92 108 65 133 90 118 60 116 104 93 
y 103 100 70 111 94 130 72 127 I 82 
2 
解 : 回归 方程 的 计算 分 为 四 步 进行 。 
(1) 如 图 4-31, 将 表 4- 22 中 的 数据 导入 SPSS 数据 编辑 器 的 
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《2) 如 图 4- 32, 执 行 [分 析 】 人 [回归 】 信 线 性 ] 程 序 , 出 现 * 线 性 回 
归 ? 对 话 框 。 























ET 省 


ECE EET 
区 要 DD 











图 4-32 


(3) 如 图 4-33, 将 左边 方 框 中 的 “高 考 成 绩 [y]? 选 入 右边 “ 因 变 
量 " 栏 目下 的 方 框 中 ,将 “调研 测试 成 绩 [x1]、-- 模 成 绩 [x2]、 二 模 成 
绩 [x2]" 选 入 右边 “ 自 变量 ?栏目 下 的 方 框 中 。 依 次 单 击 “ 统 计量 ”、 
“图 ”“ 保 存 ”、“ 选 项 ”按钮 , 设 定 方法 参见 例 4 - 9。 








括 H 生 加- 图 | 全 让 区 | 达 项 @) 


围 4-33 


(4) 单 击 “ 确 定 ” 按 钮 ,执行 线性 回归 分 析 程序 。 输 出 结果 见 表 
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-2 站 至 表 4-25， 
表 4-23 模型 摘要 (b) 
调整 的 R 方 估计 的 标准 差 
0. 928 5. 945 


模型 R 

1 0. 969(a) 
a 预测 变量 , (常量 ) ,二 模 成 绩 , 一 模 成 绩 , 调 研 测试 成 绩 。 

b 因 变 量 :高 考 成 绩 。 

表 4-23 中 ,第 1 列 说 明 回归 分 析 采 用 的 是 模型 1; 第 2 列 4 个 
变量 之 间 的 复 相关 系数 R 值 是 0. 969, 说 明 自 变量 “二 模 成 绩 、 一 模 
成 绩 、 调 研 测试 成 绩 ” 与 因 变 量 “ 高 考 成 绩 ” 的 相关 程度 很 高 ;第 3 列 
确定 系数 R* 值 是 0. 939, 说 明 自 变 量 * 二 模 成 绩 、 一 模 成 绩 、 调 研 测 
试 成 绩 ” 与 常数 可 以 解释 因 变量 “高 考 成 绩 ” 中 的 93.9%; 第 4 列 调 
整 的 R* 值 是 0.928; 第 5 列 估计 的 标准 差 值 为 5. 945 ,表示 的 是 根据 





























回归 方程 用 自 变量 估计 因 变 量 的 残 差 标 准 差 。 
表 4-24 方差 分 析 衷 (b) 












自由 度 | 均 方 (方差 ) 


3 2903. 224 


16 35.345 
19 


a 预测 变量 :( 常 量 ) ,二 模 成 绩 ,一 模 成 绩 ,调研 测试 成 绩 。 
b 因 变 量 :高 考 成 绩 ， 

在 表 4-24 中 ,用 方差 分 析 法 检验 多 元 线性 回归 方程 的 有 效 性 。 
由 于 下 值 为 82. 139,F 分 布 的 伴随 概率 为 0.000, 即 零 假设 “全 部 回 
归 系 数 为 0” 成 立 的 概率 为 0.000, 因 此 ,拒绝 零 假设 ,说 明 回归 方程 
有 效 。 即 二 模 成 绩 , 一 模 成 绩 , 调 研 测试 成 绩 与 高 考 成 绩 之 间 存 在 
线性 相关 关系 。 

在 表 4 -25 中 ,首先 交代 了 线性 回归 模型 是 1, 估 计 参 数 包括 常 
a 和 回归 系数 5b 、b。、6bs( 即 自 变 量 调研 测试 成 绩 、 一 模 成 绩 ,二 横 
成 绩 的 系数 )。 在 没有 进行 标准 化 处 理 前 , 求 得 常量 a 的 估计 值 是 


显著 性 

















8709. 673 0. 000(a) 
















565. 527 











9275. 200 
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30. 229 ,标准 误 为 6. 836; 回归 系数 乌 的 估计 值 是 0. 506, 标 准 误 是 
0. 147; 回 归 系 数 5 的 估计 值 是 0. 240, 标 准 误 是 0. 137; 回 归 系 数 如 
的 估计 值 是 0. 033 ,标准 误 是 0. 173。 由 于 数据 属于 小 样本 ,因此 服 
从 : 分布。 计算 常量 a 相应 的 上 值 为 4.422, 相 应 的 伴随 概率 是 
0. 000, 显 然 ,用 上 统计 量 检验 零 假 设 1 常数 。 为 0" 的 概率 是 0. 000， 
































因此 ,拒绝 零 假 设 1。 计 算 匠 





归 系 数 六 相应 的 上 值 为 
伴随 概率 是 0. 003 ,显然 , 用 上 统计 量 检验 零 假 设 2“ 回 




















3. 439 ,相应 的 


归 系 数 六 为 








0” 的 概率 是 0.003, 因 此 ,拒绝 零 假设 2, 认 为 调研 测试 成 绩 与 高 考 成 
绩 之 间 存 在 线性 相关 关系 。 计 算 回 归 系 数 5 相应 的 1 值 为 1.755， 


相应 的 伴随 概率 是 0.098, 显 然 , 用 :统计 量 检验 零 假设 2* 
bs 为 0” 的 概率 是 0.098, 可 以 拒绝 零 假设 2, 认 为 一 模 成 绩 





回归 系数 
与 高 考 成 


绩 之 间 存在 线性 相关 关系 。 计 算 回 归 系 数 5 相应 的 上 值 为 0. 193， 


相应 的 伴随 概率 是 0. 849, 这 时 用 t 统计 量 检验 零 假 设 2” 





回归 系数 


bs 为 0" 的 概率 是 0. 849 ,这 时 应 接受 零 假 设 2, 认 为 二 模 成 绩 与 高 考 
成 绩 之 间 不 存在 线性 相关 关系 。 
表 4-25 回归 系数 (a) 


















































非 标准 化 系数 | 标准 化 系数 se 
模型 | 工 值 | 显 者 性 | ”于 信 区 加 
B “| 标准 误 Beta 下 限 | 上 限 
(党 考 ) |30. 229| 6.836 | 4. 422 | 0. 000 | 15. 737 |44. 720 
i 人 0.506 | 0. 147 0. 658 3.439 | 0.003 | 0. 194 | 0. 818 
一 模 成 绩 | 0. 240 | 0. 137 0. 294 1.755 | 0. 098 | 一 0.050| 0. 529 
二 模 成 绩 | 0. 033 | 0.173 | 0.036 |0.193 | 0.849 | 一 0.334| 0. 401 
a 因 变 量 : 高 考 成 绩 。 
这 时 ,从 自 变 量 中 剔除 “二 模 成 绩 ”, 再 重复 上 述 1 一 4 步 , 执 行 
多 元 线性 回归 分 析 后 ,可 以 得 到 表 4-26、 表 4-27、 表 4-28。 
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表 4-26 模型 摘要 (b) 









































模型 | RR R: 调整 的 R* ”| 估计 的 标准 差 
1 0. 969(a) 0.939 0.932 5.774 
a 预测 变量 :( 常 量 ),…- 模 成 绩 ,调研 测试 成 绩 。 
b 因 变 量 , 高 考 成 绩 。 
表 4-27 方差 分 析 训 (b) 
模型 平方 和 | em 均 方 (方差 ) | F 值 | 显著 性 
回归 8708. 356 4354. 178 130. 585 | 0.000(a) 
1 残 差 566. 844 33. 344 
合计 | 9275. 200 








a 预测 变量 : (常量 ) ,一 模 成 绩 ,调研 测试 成 绩 。 
b 因 变 量 :高 考 成 绩 。 


表 4-28 回归 系数 (a) 

















































非 标准 化 系数 | 标准 化 系数 Be 

模型 T 值 | 显著 性 | 置信 区 间 

B 标准 误 | Beta 下 限 | 上 限 

(常量 ) |31,076| 5. 091 6. 104 | 0. 000 | 20. 334|41. 818 

T 
调研 浏 

二 试 成 绩 0. 523 | 0. 115 0. 680 4. 548 | 0. 000 | 0. 280 | 0.765 
一 模 成 绩 | 0. 250 | 本 2 0. | 2. 050 | 0. 056 | 一 0. 007| 0. 508 











量 :高 考 成 绩 。 


对 表 4-26、 表 4-27. 表 4-28 的 解释 参见 前 面 说 明 。 
所 以 ,所 求 得 的 测验 成 绩 间 多 元 线性 回归 方程 为 9 = 0. 523x, 十 


0.25z; 十 31. 076 。 


三 、 方差 分 析 与 平均 数 差异 检验 
1 适用 单 因素 方差 分 析 进 行 班级 间 成 绩 对 比 研究 


【 例 4-11】 在 例 4-6 中 ,已 经 使 用 SPSS 软件 , 运 
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单 因素 方 


差分 析 法 分 析 了 某 校 初 三 年 级 六 个 班 上 学 期 期 末 测 验 数 学 成 绩 的 
差异 情况 ,现在 请 用 EXCEL 软件 对 该 例 中 六 个 班 的 数学 测验 成 绩 
进行 分 析 与 比较 。 

解 : 用 EXCEL 软件 共 分 5 步 完 成 。 

(1) 打开 已 经 输入 数据 的 EXCEL 工作 表 , 将 数据 整理 成 图 4 - 
34 的 排列 形式 。 
































CICACDY. EH REN 





图 4-34 


《2) 如 图 4-35, 执 行 [工具 /人 [数据 分 析 】 程 序 , 出 现 “ 数 据 分 析 ” 
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( 注 :如 果 “ 工 具 ” 莱 单 中 没有 出 现 “ 数 据 分析 ” 命 令 , 需 要 先 按照 
“分 析 工 具 库 ”, 安 装 方法 为 :在 “工具 ”菜单 中 单 南 “ 加 载 宏 "命令 , 选 
中 “分 析 工 具 库 ” 复 选 框 即 可 ) 

《3) 如 图 4-36, 在 “数据 分 析 ” 对 话 框 的 “分 析 工具 ”栏目 下 选中 
“方差 分 析 : 单 因素 方差 分 析 ” 选 项 ,然后 单 击 “ 确 定 ” 按 钮 ,出 现 “ 方 
差分 析 ; 单 因素 方差 分 析 ” 对 话 框 。 





















































图 4-36 


(4) 如 图 4 -37, 在 “方差 分 析 : 单 因素 方差 分 析 ” 对 话 框 中 ,“ 输 
入 区 域 "栏目 后 的 方 框 中 输入 $A $2; $F $52( 即 用 局 标 选 中 A2;F52 
的 数字 区 域 ，,“ 分 组 方式 ”栏目 选中 “ 刺 ”选中 “标志 位 于 第 一 行 ”; 
显著 性 水 平 为 “0.05”;“ 输 出 选项 "栏目 下 选中 “输出 区 域 ”, 在 工作 
表 中 选择 一 个 单元 格 (如 饭 简 , 即 14) 作 为 输出 区 域 左 上 角 的 第 一 个 
单元 格 。 


























方 其 分 析 : 趾 国 流 方 其 分 析 








图 4-37 
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(5) 单 击 “ 确 定 ” 按 钮 , 则 在 工作 表 的 输出 区 域内 显示 单 因素 方 
差分 析 “ 计 算 表 ”和 “分 析 表 ”, 如 图 4 一 38。 





















求 和 ”平均 ” 方 状 
1 班 50 6838 136.76 60. 96163 
50 6721 134.42 216. 2486 
3 班 50 3955,. 79.1.1997.765 
IWF 50. 3926 78. 52 1838. 867 


_ 5 班 50.. 4197 83.94. 1784.67 
6 班 50 4340 86. 8 1579. 592 











SS df TT F P-value F crit 
组 间 193318.14 5 38663, 63:31. 02147 2, 518-25 2. 2447033 
组 内 366427.1 294 1246. 351 
745.24， oe 
ER er > 
图 4-38 


根据 图 4- 38 中 的 数据 作出 统计 推断 。 
由 于 下 二 31.02 > 2.24 = Fo.os ,根据 右 尾 下 检验 推断 规则 ,在 
0. 05 显著 性 水 平 上 拒绝 零 假设 “六 个 班 平均 分 无 差异 ”, 因 此 ,作出 
推断 :六 个 班 的 平均 分 有 显著 差异 。 

从 六 个 班 的 平均 分 可 以 看 出 ,1 班 和 2 班 作为 一 个 整体 ,与 其 他 
4 个 班 作为 一 个 整体 ,两 个 部 分 之 间 差 异 明显 。 至 于 4 班 至 6 班 是 
否 有 上 明显 差异 ,可 以 用 函数 “TTEST” 做 进一步 的 检验 。( 此 处 略 》 

2. 运用 双 因 素 方 差分 析 测 验 卷 的 等 值 问题 与 学 生 的 学 习 
差异 

【 例 4-12】 Al、A2、A3、A4 等 四 所 中 学 的 高 三 学 生 先后 做 
三 套 高 考 数学 模拟 测验 卷 ,测验 平均 分 如 表 4 - 29 ,请 用 SPSS 软件 
分 析 三 套 高 考 数学 模拟 测验 卷 是 否 等 值 ? 四 所 学 校 的 学 生 水 平 是 
否 一 致 ? 
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表 4-29 四 所 中 学 三 套 测 验 卷 平 均 分 

















模拟 测验 卷 
Bl B2 B3 
Al 97.5 125 112 
A2 88.5 118 108 
学 校 
A3 81 120 105 
A4 78 115 110 














解 : 测验 卷 的 等 值 检 验 与 学 校 学 生 水 平 检验 的 方差 分 析 分 为 四 
步 进行 。 

(1) 如 图 4-39, 将 表 4-29 中 的 数据 导入 SPSS 数据 编辑 器 的 
工作 表 中 ,注意 导入 时 的 数据 排列 方式 。 





文件 ) 鲍 可 QD 视 用 WD 小 大 QQ) 转换 避 分 析 () 
开 疹 G@) 实用 息 序 QD 伪 口 0D 帮助 GD 





图 4-39 


(52) 如 图 4 - 40, 执 行 [分 析 】 作 常规 线性 模型 ]/[ 单 变量 } 程 序 ， 














出 现 * 单 变量 "对 话 框 ( 特 别 说 明 :这 里 的 单 变量 指 的 是 单 因 变量 )， 
如 图 4-41。 
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EB] wo| sv!l am | ww | 
图 4-41 


(3) 在 图 4-41 中 ,把 左边 “数学 平均 分 ”变量 导入 到 右边 “ 因 变 














量 ” 下 的 空 框 中 ,把 左边 “学 校 "“ 测 验 卷 ”变量 导入 到 右边 “固定 
子 ” 下 的 空 框 中 。 

《4) 对 “ 单 变量 ”中 的 六 个 中 的 五 个 按钮 “模型 >“ 对 比 ”"“ 图 ”、 
“两 两 比较 ”、“ 选 项 ”中 的 选项 进行 选择 ,基本 的 选择 项 与 选择 方法 
如 图 4-42、4-43、4-44、4-45、4- 46 所 示 (“ 保 存 ” 选 项 没有 操 
作 , 有 兴趣 的 读者 可 以 自行 探索 不 同 的 选择 ,再 将 分 析 结 果 进 行 比 
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较 ), 每 个 选项 选择 完 后 , 单 击 “ 继 续 ? 按 钮 ,返回 图 4-41。 














厅 在 模型 中 包 合 铬 并 GD) y 


Cus] mw | 


图 4-42 








对 比 四 ; 凯利 过] 
i 人 最 后 -个 外 个 第 个 





图 4-43 











图 4-44 
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单 橙 星 : 观测 均值 的 断 丙 比 输 


再 机 比较 检 验 ): 





| 


促 定 方 袭 齐 人 性 


1s00) 


LT Bonferroni (B) 


Tm sidart) 


| 


长 SS 和合) rae, 
| yD,w 广 Dot 


"Semffo C) 厂 pmmcan 人) 
厂 Ra-G- G) [Hochberg z cr20D 和 
TR 0) Gerio (@) 


20) Domett TIG) TT Gmerkoreli) 三 Danaetts CU) 





图 4-45 









; 畏 出 








(5》 单 址 
分 析 程 序 。 输 ! 








而 

















,车 计 边际 均值 一 
因子 与 因子 次 可 @) 


个 揣 由 统计 GD) 三 方 束 齐 性 检验 0D 


， 厂 功 改 车 计 @) 厂 分 布 -水 平 图 多 ) 1 
| 厂 检验 效能 中 ) 人 三 残 整 图 GB) 

三 参数 估计 I) 三 献 乏 拟 合 忧 朗 检 验 (L) 

下 比 坟 未 数 矩阵 [7 厂 一 般若 计 函 数 @G) 


显著 性 水 平 wJ): [05 ”者 依 区 间 为 95% 





显示 均 们 季 ) | 









[a 












| 
图 4-46 


4-41 中 的 “确定 ”按钮 ,执行 单 因 变量 双 因 素 方差 
见 表 4-30 至 表 4-38。 
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表 4-30 主体 间 效 应 的 检验 





























因 变 量 ,数学 平均 分 
变 差 来 源 | ”于 型 平方 和 Ey 均 方 F 值 | 显著 性 Sig. 

校正 模型 2504. 667(a) 5 500.933 | 28.489| .000 
截 距 131880. 333 1 | le80. 333 | 7500. 303| .000 

学 校 201. 500 3 67. 167 3.820| .076 
测验 卷 2303. 167 1151. 583 65. 493| .000 
误差 105. 500 6 17. 583 扑 

总 计 134490. 500 1 

校正 的 总 计 | ”2610. 167 11 











a 回归 系数 平方 =0. 960( 调 整 后 的 回归 系数 平方 二 0. 926) 。 


表 4 -30 中 ,第 一 列 是 变 差 的 来 源 ,其 中 “校正 模型 的 变 差 ”= 学 
校 的 变 差 十 测验 卷 的 变 差 , 这 里 校正 去 掉 了 截 距 项 。 
“校正 的 总 计 ” 二 校正 模型 的 变 差 十 误差 项 的 变 差 。 第 六 列 的 相伴 
概率 值 均 小 于 0. 01, 说 明 在 学 校 与 测验 卷 的 不 同 水 平 .不同 组 合 中 ， 
至 少 有 的 效果 之 间 , 有 显著 性 差异 。 

表 4-31 不 同学 校 数学 平均 分 的 对 比 结果 














学 校 因 变 内 
简单 对 比 (a) | 数学 平均 分 
对 比 估算 值 10. 500 
假设 值 0 
差分 (估计 一 假设 》 10. 500 
级 别 1 和 级 别 4 | 标准 误 3.424 
Sig. .022 
差分 的 95% 舞 信 区 间 下 限 2.122 
上 限 18. 878 
Ws: 
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《〈 续 胡 ) 











学 校 因 变 量 
简单 对 比 Ca) 数学 平均 分 
对 比 估算 值 3. 833 
假设 值 0 
差分 (估计 一 假设 ) 3. 833 
级 别 2 和 级 别 4 | 标准 误 3. 424 
Sig. 306 
差分 的 95% 置 信 区 问 下 限 一 4. 544 
上 限 过 :地 
对 比 估 算 值 1.000 
假设 值 0 
差分 (估计 一 假设 1. 000 
级 别 3 和 级 别 4 | 标准 误 3. 424 
Sig. .780 
差分 的 95%% 置 信 区 间 下 限 Sp 
上 限 9. 378 





a "参考 类 别 二 4。 


表 4-31 给 出 了 四 所 学 校 的 数学 平均 分 的 比较 结果 ， 


1( 学 校 A1) 与 级 别 4( 学 校 A4) 的 相伴 概率 值 为 0.022 < 0. 05, 表示 
学 校 Al 与 学 校 A4 的 数学 平均 分 有 显著 性 差异 ;同样 方法 ,我 们 可 
以 看 出 学 校 A2 与 学 校 A4、 学 校 A3 与 学 校 A4 间 的 数学 平均 分 并 
没有 显著 性 差异 。 

表 4-32 不 同学 校 之 间 数 学 平均 分 的 检验 结果 














于 级 别 


























源 平方 和 
对 比 201. 500 076 
误差 105. 500 














表 4-32 表明 ,从 方差 分 析 的 角度 看 ,由 于 相伴 概率 值 0. 076 > 
0. 05, 因此 ,不 同学 校 之 间 的 数学 平均 分 的 差异 不 显著 。 
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表 4-33 不 同 数学 测验 卷 之 间 平 均 分 的 检验 结果 




















测验 卷 因 变 量 
简单 对 比 (a) 数学 平均 分 
对 比 估 算 值 —22.500 
假设 值 0 
差分 (估计 一 假设 ) = 0 
级 别 1 和 级 别 3 | 标准 误 2. 965 
Sig. . 000 
差分 的 95%% 置 信 区 间 下 限 一 29.755 
上 限 一 15. 245 
对 比 估算 值 10. 750 
假设 值 0 
差分 (估计 一 假设 ) 10. 750 
级 别 2 和 级 别 3 | 标准 误 2.965 
Sig. .011 
差分 的 95%% 置 信 区 间 下 限 3. 495 
上 限 18. 005 
a 参考 类 别 二 3。 


表 4-33 给 出 了 三 次 测验 之 间 数 学 平均 分 的 比较 结果 ， 











于 级 











别 1( 测 验 卷 B1) 与 级 别 4( 测 验 卷 B3) 的 相伴 概率 值 为 0.000 < 


0. 05, 表示 测验 卷 Bl 与 测验 卷 B3 的 数学 平均 分 有 显著 性 差异 ; 同 
样 方法 ,我们 可 以 看 出 测验 卷 B2 与 测验 卷 B3 之 间 的 数学 平均 分 也 


有 显著 性 差异 。 





表 4-34 不 同 测验 卷 之 间 数 学 平均 分 的 检验 结果 











源 平方 和 af 均 方 F Sig. 
对 比 2303. 167 2 1151.583 | 65.493 .000 
误差 105. 500 6 17. 583 

2 

















表 4-34 表明 ,从 方差 分 析 的 角度 看 ,由 于 相伴 概率 值 0. 000 一 
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0. 05, 因 


此 ,不 同 测验 之 间 的 数学 平均 分 的 差异 显著 。 


表 4-35 边际 均值 估算 (1) :不 同学 校 数学 平均 分 的 边际 均值 


























号 | | 95% 置 信 区 间 

学 术 均值 标准 误 

Al 111. 500 2. 421 105. 576 117. 424 

A2 104. 833 2.421 98. 909 110. 757 

A3 102. 000 2.421 96. 076 107. 924 

Ad 101. 000 2. 421 95. 076 106. 924 
表 4 - 36 边际 均值 估算 (2) ;不同 测验 卷 数学 平均 分 的 边际 均值 











95% 置 





信 区 间 


























学 校 均值 标准 误 
下 限 上 限 
= 
Bl 86. 250 2. 097 81. 120 91. 380 
B2 119. 500 2. 097 114. 370 124. 630 
B3 108. 750 2. 097 103. 620 113. 880 





表 4-37 不 同学 校 之 间 数 学 平均 分 的 两 两 比较 





















































了 
(7 学 校 | (J 学 校 et 标准 Sig. 0, 
A2 6.6667 | 3.42377 | .099 | 一 1.7110| 15.0443 
Al A3 9.5000(* ) | 3.42377 | .032 1. 1223| 17. 8777 
A4 10. 5000(* ) | 3.42377 | .022 2. 1223| 18. 8777 
Al 一 6.6667 | 3.42377 .099 | 一 15. 0443 1.7110 
A2 A3 2.8333 | 3.42377 | .440 | 一 5.5443| 11.2110 
A4 3. 8333 .306 | 一 4.5443| 12.2110 
A3 Al . 5000( * ) 
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《 续 表 ) 












































(学 校 |( 刀 学 校 和 标准 误 Sig. ee 
A2 一 2.8333 | 3.42377 | .440 | 一 11.2110| 5.5443 
全 A4 1.0000 | 3.42377 | .780 | 一 7.3777| 9.3777 
Al | 一 10.5000C* ) | 3.42377 | .022 | 一 18.8777| 一 2 1223 
A4 A2 一 3.8333 | 3.42377 | .306 | 一 12.2110| 4.5443 
A3 一 1.0000 | 3. | | 7.3777 
基于 观测 到 的 均值 。 
* ”均值 差 值 在 . 05 级 别 上 较 显著 。 
表 4-37 显示 ,四 所 学 校 中 ,学 校 Al 的 学 生 水 平 与 学 校 A3、 
A4 之 间 有 着 比较 显著 的 差异 ,其 他 学 校 之 间 的 学 生 数 学 水 平 没 有 





显著 性 差异 。 
表 4-38 不 同 测验 卷 之 间 数 学 平均 分 的 两 两 比较 


《CD 测 | 7) 测 | 均值 差 个。 | 标准 误 | si 95% 置 信 区 间 


验 卷 | 验 卷 (I—D 和 
[EE 下 限 上 限 


B2 |—33.2500(*) | 2.96507 | .000 | 一 40.5053| 一 25.9947 








Bl 
B3 Ee 5000( # ,| | :000 和 29. 7553| 一 15. 2447 


el 



































Bl 33. 2500(* ) | 2.96507 | .000 25. 9947| 40. 5053 
B2 广 

B3 10.7500(* ) | 2.96507 | .011 3. 4947| 18.0053 

Bl 22. 5000(* ) | 2.96507 | .000 15.2447| 29.7553 
B3 

B2 | 一 10.7500(* ) | 2.96507 | .011 | 一 18.0053| 一 3.4947 
本 = 
基于 观测 到 的 均值 。 


* ”均值 差 值 在 .05 级 别 上 较 显著 。 


表 4-38 显示 ,三 套 测 验 卷 的 平均 分 有 显著 差异 ,说 明 这 三 套 高 
考 数学 模拟 测验 试卷 并 不 等 值 。 
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试卷 分 析 报 告 的 基本 模式 





撰写 试卷 分 析 报告 的 目的 是 为 了 全 面 认识 测验 的 效果 ,正确 理 
解 测验 成 绩 传达 的 信息 ,指导 教师 更 有 效 地 开展 教学 ,帮助 学 生 更 
好 地 进入 下 一 阶段 的 学 习 。 根 据 撰写 人 的 不 同 ,试卷 分 析 报告 可 以 
分 为 学 生 测验 后 反思 .教师 测验 后 分 析 与 专业 人 员 测 验 后 系统 分 析 
等 三 种 形式 ;根据 测验 性 质 与 规模 的 不 同 ,试卷 分 析 报告 又 可 以 分 
为 单元 测验 分 析 、 学 期 测验 分 析 与 大 规模 考试 ( 联 考 与 统考 等 ) 分 
析 。 无 论 是 哪 种 试卷 分 析 报 告 ,都 需要 从 定性 与 定量 两 个 角度 展 
开 , 并 综合 运用 各 种 统计 量 、 统 计 图 表 对 测验 结果 进行 统计 分 析 , 这 
既是 评价 测验 质量 、 测 验 成 绩 的 基本 方法 ,也 是 形成 试卷 分 析 报 告 
的 基本 形式 。 





一 节 ”试卷 分 析 报告 的 基本 框架 


根据 试卷 结构 与 设计 目标 ,试卷 分 析 应 从 整 卷 . 题 组 .题目 等 三 
个 不 同 层面 有 目的 .有 侧重 地 报告 有 关 测 验 信 息 ,进行 有 关 统 计 推 
断 , 旨 在 较为 全 面 ,深入 地 展示 测验 的 整体 面貌 。 下 面 以 某 市 某 年 
中 考 数学 质量 分 析 数 据 为 例 进行 说 明 。 

一 、 整 卷 层面 


测验 卷 整 体 设计 与 测验 效果 的 宏观 分 析 是 试卷 分 析 报 告 的 核 
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心 内 容 , 它 向 教师 与 学 生 展 现 测 验 目标 达成 状况 .测验 结果 的 分 布 
状态 ,有 利于 教师 掌握 面 上 的 教学 情况 ,也 有 利于 学 生 了 解 自己 在 
班级 ,年 级 .地 区 所 处 的 位 置 。 

整 卷 层面 的 分 析 通常 包括 试卷 的 考查 内 容 、 考 查 结构 与 考查 方 
式 的 研究 ,测验 成 绩 的 一 般 数 量 指标 (集中 量 数 .差异 量 数 等 ) .质量 
指标 ( 信 度 .难度 .区 分 度 等 ) 的 介绍 与 分 析 , 测验 成 绩 分 布 状态 的 呈 
现 与 分 析 等 。 

1， 整 卷 考查 目标 、 考 查 内 容 与 题 型 结构 分 析 

基 市 某 年 中 考 数学 学 科 考 试 时 间 120 分 钟 , 卷 面 满分 为 150 分 。 
全 卷 共 三 大 题 ,25 小 题 ,其 中 选择 题 10 小 题 , 填 空 题 6 小 题 ,解答 题 
9 题 。 客 观 性 试题 共 30 分 , 占 全 卷 总 分 的 20% 。 试 卷 的 具体 结构 与 
上 年 对 比如 表 5 -1。 

表 5-1 统计 显示 ,除了 试题 难度 比例 做 了 较 多 的 调整 ,其 中 容 
易 题 增加 了 12 个 百分点 ,难题 增加 了 6 个 百分点 ,相应 地 中 等 题 减 
少 了 18 个 百分点 ,其 他 的 目标 结构 .内 容 结 构 、 题 型 结构 等 部 分 仅 
仅 具 有 微小 的 波动 。 各 项 特征 构成 分 布 的 纵向 差异 ,经 过 x 检验， 
均 不 具有 显著 性 (p > 0.05), 说 明 本 年 度 的 中 考 命题 与 上 年 度 相 
比 , 较 好 地 贯彻 了 “ 稳 中 有 变 ” 的 指导 方针 。 

2， 整 卷 的 数量 特征 

整 卷 的 数量 特征 包括 两 个 部 分 ,一 部 分 是 报告 全 体 考生 的 整 卷 
量化 指标 及 其 相关 分 析 , 另 一 部 分 是 报告 不 同 区 域 ( 如 ,行政 区 域 、 
学 校 \ 班 级 等 ,根据 实际 需要 选择 适当 的 数据 整理 方法 ) 的 整 卷 量 化 
指标 及 其 相关 分 析 。 如 果 是 大 型 考试 (如 中 考 、 高 考 等 ), 就 需要 向 
学 校 公布 不 同 区 域 .不 同学 校 的 整 卷 分 数 的 量化 指标 并 给 出 相关 
分 析 。 

下 面 仅仅 给 出 第 一 部 分 的 数据 及 其 分 析 。 

表 5-2 中 , 整 卷 的 各 个 基本 量化 指标 的 计算 都 是 根据 全 体 考生 
的 测验 成 绩 由 计算 机 完成 。 整 卷 难 度 值 为 0. 60, 说 明 全 卷 难度 适 
中 ,符合 中 考 学 业 水 平 考试 的 要 求 。 
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表 5-2 整 卷 常规 量化 指标 分 析 






分 
含 往届 生 | 114523 
去 掉 往 届 生 | 112911 


整 卷 的 区 分 度 达 到 0. 60, 属于 优秀 级 别 ,反映 出 该 试卷 对 考生 
的 能 力 进行 了 很 好 的 区 分 ,说 明 该 份 中 考试 卷 很 好 地 兼顾 了 高 中 招 
生 的 需求 。 

整 卷 的 信 度 值 为 0. 92 ,说明 该 次 中 考 数学 测验 卷 所 测 内 容 的 同 
质 性 程度 很 高 ,达到 最 好 的 标准 化 考试 的 水 平 。 

3， 整 卷 的 分 数 分 布 

表 5-3 统计 显示 ,学 生 的 成 绩 分 布 较为 理想 ,其 中 成 绩 在 0~ 
50 分 的 学 生 占 总 人 数 的 18. 8 外 , 约 有 57. 19% 的 学 生成 绩 在 90 一 
139 分 ,试卷 较 好 地 区 分 出 不 同 能 力 层次 学 生 的 数学 学 习 水 平 , 反 映 
出 该 地 区 初中 生 数 学 学 习 情况 。 

囊 5-3 全 体 考生 数学 成 绩 按 分 数 段 的 频数 统计 














36. 59 0. 60 0. 92 


















































分 数 段 人 数 百分比 (%》 累积 百分比 (%) 
0 54 0.05 0.05 
1~9 1105 0. 96 1.01 
10~19 EF 3298 2. 88 3. 89 
20~29 4977 4. 35 8. 24 

Ee 
30~49 6077 5. 31 13. 55 
40 一 49 6009 5. 25 18. 80 
50~59 | 6024 5. 26 24. 06 
60~69 6140 和 5. 36 29. 42 
70~79 6819 5.95 35. 37 
80~89 7848 | 42. 22 
2 
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( 续 表 ) 
































分 数 段 人 数 百分比 (%》 累积 百分比 (%) 
90~99 8593 7.5 49.72 
100~109 9935 8. 68 58. 40 
110~119 14309 12.49 | 70. 89 
120~129 21315 18. 61 89. 50 
130~139 11352 9.91 99. 41 
140~149 658 0.57 99. 98 

150 10 0.01 99. 99 
总计 114523 99. 99 











根据 表 5 - 3, 利 用 EXCEL 软件 制作 考生 成 绩 分 布 直 方 图 如 图 





























0 | : 
0 5 15 25 35 45 55 6 75 85 95 105 115 125 135 145 150 
分 数 


图 5-1 考生 数学 成 绩 分 布 直方 图 


图 5-1 显示, 考生 的 考分 频率 分 布 直方 图 呈 负 偏 态 ,说 明 数 学 
考试 的 全 卷 难 度 适 中 略 偏 易 。 考 生成 绩 没有 出 现 双 峰 现象 ,说 明 数 
学 学 习 两 极 分 化 现象 没有 凸显 。 


二 、 题 组 层面 


1， 题 组 的 整体 数量 指标 
表 5-4 统 计 显示 ,选择 题 整体 最 简单 ,其 次 是 填空 题 ,解答 题 的 
难度 最 大 。 总 体 而 言 ,三 种 题 型 的 区 分 度 都 达到 优秀 标准 。 
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甫 5-4 分 题 组 的 量化 指标 


































































































2， 

5 3 2.7 0.9 0.9 0.34 

选择 是 -| 
| 。 3 2. 32 0.77 1. 25 | 0 58 

十 一 

7 3 2.56 0. 85 1.06 0.35 

| pt 
8 3 2.19 0.73 后 3 0. 58 
9 3 1. 85 0. 62 1. 46 0. 48 
| 10 3 2. 59 0. 86 1.04 0. 35 

f 
11 3 2.54 0.85 1.08 0. 51 
12 3 2.77 ij 0.92 0.79 0. 20 
13 3 2.07 0. 69 1.35 0.74 
六 空 是 

14 3 2.51 0. 84 > 0.41 
5 3 2. 41 0. 80 1. 20 0. 45 
16 3 :1 0.37 1.45 0.16 
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题 型 试题 号 满分 平均 分 难度 “| 标准 差 | 区 分 度 
17 9 7.19 医 0. 80 3. 31 0. 67 
| 6. 97 0.77 2.91 0.52 
19 10 5.27 0.53 4. 27 0. 91 
20 10 6 0. 69 3. 69 0.78 
解答 题 21 12 ] 7. 98 0. 67 4. 31 0.79 
22 12 6. 31 0.53 5.51 0. 95 
23 12 6. 29 0.52 4.48 0. 85 
24 14 4. 09 0.29 3,58 0.54 
25 14 1.5 0.11 2.06 0. 26 














根据 表 5-5 的 统计 信息 ,结合 不 同 统计 指标 可 以 进行 深入 的 
分 析 。 

2， 试 题 编排 情况 

根据 表 5 - 5 中 试题 的 难度 状况 ,利用 EXCEL 软件 制作 整 卷 试 
题 难度 编排 动态 曲线 图 ,如 图 5 -2。 从 整体 上 看 , 整 卷 试题 的 编排 
顺序 呈现 出 由 易 到 难 、 逐 步 递 进 的 结构 。 其 中 ,第 1 一 10 题 为 选择 
题 ,第 11 一 16 题 为 填空 题 ,第 17 一 25 题 为 解答 题 ,开卷 中 的 第 1 题 、 














1.00 
0.90 上 > 

1 pi, 
0.70F- 
0.60 上- 


0.40 上- 
030 上 - 
0.20 上- 
0.10|--- 
0.00 














12345678 9 101112131415 1617181920212232425 
题 号 


围 5-2 整套 试题 难度 编排 动态 曲线 
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题 型 转换 的 起 始 题 (第 11、16 题 ) 相 对 较为 容易 ,每 种 题 型 中 都 有 相 
对 较 难 的 试题 ; 整 卷 中 最 难 的 两 道 题 放置 在 最 后 (第 24、25 题 ) , 难 
度 值 分 别 达 到 0. 29 与 0. 11。 整 体 而 言 , 整 卷 的 试题 编排 合理 ,有 利 
于 考生 以 良好 的 心理 状态 答卷 并 发 挥 自 己 的 最 好 水 平 。 而 且 全 卷 
的 容易 题 .中 等 题 ,难题 的 分 值 比例 约 为 51 : 78 : 21, 也 部 分 说 明 全 
卷 难 度 总 体 适中 。 

稍 嫌 不 足 的 是 , 整 卷 的 选择 题 部 分 波动 平稳 ,基本 上 都 属于 容 
易 题 ,难度 梯度 不 明显 ,成 为 考生 得 分 的 主要 部 分 。 

3. 试题 区 分 度 状 况 

根据 表 5 - 5 中 试题 的 区 分 度 状 况 , 利 用 EXCEL 软件 制作 整 卷 
试题 区 分 度 情况 动态 曲线 图 ,如 图 5 - 3。 从 整体 上 看 ,试卷 中 偏 难 
试题 (如 第 16、24、25 题 等 ) 与 偏 易 试题 (如 第 1、2、12 题 等 ) 的 区 
分 度 效果 一 般 , 而 中 等 难度 的 试题 (如 第 19、22、23 题 等 ) 的 区 分 度 
效果 非常 理想 。 整 卷 的 区 分 度 高 达 0. 60, 说 明 整 卷 的 区 分 度 指标 很 
优秀 。 试 卷 中 ,区 分 度 小 于 0. 2 的 试题 只 有 第 16 题 ,相应 的 区 分 度 
值 是 0. 16, 具 体 情况 在 试题 分 析 部 分 应 给 予 详细 分 析 。 























i Ta k Li 
I 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 


题 号 
图 5-3 整 关 试 题 区 分 度 情况 动态 轴线 
三 、 试 题 层面 
于 各 个 试题 的 具体 数量 指标 在 题 组 部 分 已 经 给 出 ,因此 试题 层 再 
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主要 进行 定性 分 析 , 从 测验 目标 、 测 验 内 容 、 试 题 的 命 制 方式 ,考生 的 答 
题 情况 等 多 个 角度 进行 深层 次 细致 的 讨论 ,并 作出 相应 的 事实 判断 。 

1. 试题 命 制 情况 

试题 的 质量 问题 既 可 能 来 源 于 试题 命 制 方面 ,也 可 能 来 源 于 考 
生 群 体 水 平 及 其 发 挥 状 况 。 在 分 析 试 题 质量 时 ,从 命 制 的 角度 进行 
深入 分 析 , 既 有 助 于 对 教学 内 容 的 理解 与 把 握 , 也 有 助 于 对 考查 方 
式 的 使 用 与 指导 ,还 有 助 于 掌握 命题 技术 。 

对 每 个 试题 命 制 情况 的 分 析 , 可 以 从 考查 知识 点 ,试题 来 源 、 试 题 设 
计 的 题 型 使 用 情况 (是 否 发 挥 了 题 型 的 优势 ) .题目 的 功能 (对 教师 教 的 
考查 ,对 学 生 学 习 状况 的 考查 ,实际 考察 效果 ) 等 方面 逐 题 展开 研讨 , 具 
体格 式 可 以 参照 表 5 - 6 进行 ,也 可 以 不 用 列表 ,分 试题 逐一 进行 阐述 ， 
详 略 情况 由 分 析 者 自行 把 握 。 最 后 应 给 出 以 后 命题 的 改进 建议 。 

表 5-6 试题 来 源 . 题 型 使 用 及 其 功能 
. 题目 的 功能 
题 号 | 知识 点 | 试题 来 源 | 题 型 使 用 
考查 学 生 的 学 习 | 考查 教师 的 教学 


| 


25 











































































































【 例 5 -1】 试 根据 表 5 - 6 的 模式 分 析 某 
次 高 一 测验 卷 中 的 一 道 试题 :如 图 5-4, 在 正 4 
方 体 4BCD -4A, BCiD, 中 ,已 、F 为 棱 AD、 
AB 的 中 点 。(1) 求 证 : EF /平面 CB,D，， 
(2) 求 证 :平面 CAA1C | 平面 CB, D, .” 

具体 分 析 如 下 。 

1. 试题 来 源 与 主要 知识 点 
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本 试题 根据 北 师 大 版 高 中 必修 2 教材 第 49 页 A 组 习题 7 改 
编 ,考查 的 知识 点 主要 有 :空间 中 线 面 . 面 面 的 位 置 关 系 。 

2. 题目 的 功能 

(1) 考查 教师 教 的 方面 ,重点 是 引导 教师 重视 审题 的 教学 ,在 几 
何 教学 中 重视 通过 实际 模型 ,认识 点 、 线 、 面 闻 基 本 的 位 置 关 系 , 强 
调 观 察 角 度 的 选取 和 对 图 形 的 分 解 ,逐步 加 强 对 推理 和 思维 严谨 性 
的 要 求 。 

(2) 考查 学 生 学 的 方面 ,要 求学 生 掌 握 以 正方 体 为 模型 的 简单 
的 线 面 平行 与 垂直 关系 的 性 质 与 判定 的 方法 与 技能 。 

3. 题 型 使 用 

本 题 要 求 考生 书面 写 出 详细 解答 过 程 ,能 够 较为 全 面 地 检查 出 
考生 在 必修 1 立体 几何 部 分 核心 知识 的 掌握 情况 , 题 型 应 用 合理 。 

2. 考生 答题 情况 

测验 核心 目的 之 一 是 检查 考生 的 学 习 掌 握 情 况 , 因 此 ,测验 结 
束 后 对 考生 答题 情况 展开 深入 分 析 成 为 试卷 分 析 的 重要 组 成 部 分 。 

对 每 道 试题 考生 答题 情况 的 分 析 包括 考生 的 整体 答题 状况 (对 
平均 分 难度 、 区 分 度 、 标 准 差 等 指标 的 具体 分 析 )、 典 型 解答 方法 、 
最 优 解答 方法 、 典 型 错误 、 对 教学 的 启示 等 方面 的 内 容 , 具 体 可 以 参 
照 表 5 -7 进行 深入 讨论 。 

表 5-7 每 道 试题 考生 答题 情况 分 析 基本 模式 


a 














题 号 与 题目 
基本 量化 指标 | 满分 : 平均 分 : ”标准 差 : 难度 ， 区 分 度 ， 
典型 解法 
最 优 解 法 


典型 错误 
及 错 因 分 析 


对 教学 的 启示 
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第 二 节 三 种 常见 测验 的 试卷 
分 析 报 告 基 本 模式 


大 多 数 一 线 教师 习惯 于 上 试卷 讲评 课 , 但 不 习惯 动笔 撰写 试卷 
分 析 报 告 ,因为 教师 很 熟悉 试卷 中 试题 内 容 与 考生 的 答题 情况 ,而 
且 上 试卷 讲评 课 约束 相对 较 少 , 可 以 即兴 发 挥 ; 但 撰写 试卷 分 析 报 
告 的 工作 量 大 ,尤其 需要 用 到 教师 相对 陌生 的 教育 测量 学 .教育 统 
计 学 与 教育 评价 学 的 知识 ,教师 感到 为 难 。 
其 实 , 在 教师 经 常 遇 到 的 单元 测验 .学 期 测验 中 ,试卷 分 析 的 基 
本 方法 很 简单 ,也 很 容易 掌握 ,一 旦 形成 撰写 试卷 分 析 报告 的 习惯 ， 
不 仅 花费 时 间 不 多 ,而 且 对 提高 教学 的 针对 性 和 学 生 自我 认识 水 平 
等 都 有 很 大 帮助 。 

下 面 主要 介绍 单元 测验 、 学 期 测验 与 联 考 或 统考 等 三 种 常见 测 
验 的 试卷 分 析 报 告 的 基本 模式 ,具体 运用 时 ,教师 可 以 根据 具体 情 
况 适当 删 减 。 


一 、 单 元 测验 


单元 测验 的 试卷 提倡 由 教师 自行 命 制 , 或 者 由 教师 根据 现成 的 
试卷 结合 自己 所 教学 生 的 实际 学 习 状况 修改 后 形成 。 

单元 测验 的 功能 主要 定位 于 检测 某 单元 知识 的 学 与 教 的 状况 ， 
关注 的 是 某 位 教师 与 其 任教 班级 在 某 个 单元 知识 方面 的 教学 现状 ， 
相应 地 ,测验 后 的 试卷 分 析 就 应 关注 该 单元 教学 具体 细节 的 处 理 与 
掌握 情况 ,并 由 教师 和 学 生 共同 完成 分 析 报告 。 

1. 教师 扔 写 部 分 

教师 撰写 的 试卷 分 析 报告 主要 包括 学 习 内 容 与 考查 内 容 、 班 级 
整体 测验 情况 分 析 、 题 组 整体 测验 情况 分 析 、 试 题 测验 情况 分 析 、 小 
结 等 五 部 分 内 容 。 

















第 五 章 ”试卷 分 析 报 告 的 基本 模式 / 201 


学 习 内 容 与 考查 内 容 的 报告 着 重 突出 单元 学 习 知识 .技能 和 轧 
想 方 法 的 重点 ,突出 测验 是 为 教学 服务 ,学 什么 就 考 什 么 ,并 检查 测 
验 内 容 的 覆盖 率 , 确 保 基于 该 单元 测验 的 分 析 具 有 一 定 的 可 靠 性 与 
有 效 性 。 

由 于 单元 测验 属于 标准 参照 考试 ,区 分 度 不 需要 过 度 强调 ; 
且 样 本 较 小 ,测验 信 度 与 结构 效 度 的 计算 结果 仅 作 参 考 , 因 此 , 基 了 
班级 的 单元 测验 可 以 不 报告 有 关 测 验 卷 的 信 度 、 结 构 效 度 与 试题 区 
分 度 等 量化 指标 。 

在 向 全 班 同学 报告 测验 成 绩 时 ,为 了 去 除 给 学 生 排队 的 嫌疑 ， 
同时 又 方便 学 生 了 解 自 己 的 测验 成 绩 在 班级 整体 中 的 位 置 ,建议 教 
师 给 出 班级 测验 成 绩 的 茎 叶 图 。 由 于 班级 人 数 较 少 ,教师 手绘 茎 叶 
图 很 简单 ,另外 利用 SPSS 软件 制作 茎 叶 图 也 非常 简便 ,具体 请 阅读 
第 三 章 第 二 节 茎 叶 图 部 分 。 

在 分 析 题 组 情况 时 , 既 可 以 详细 汇报 每 道 题 的 常规 量化 指标 ， 
也 可 以 整体 汇报 题 组 的 常规 量化 指标 , 视 测 验 情况 而 定 。 然后 简要 
分 析 每 个 题 组 的 考查 目标 与 实际 达成 情况 。 

试题 分 析 部 分 不 需要 面面俱到 ,大 部 分 主要 集中 在 两 端 ;最 优 
解答 方法 与 暴露 问题 最 多 的 试题 剖析 。 通过 分 析 发 现 产生 错误 的 
原因 ,才能 真正 以 考 促 学 。 学 生产 生 错误 是 概念 法 则 不 清 , 还 是 计 
算 能 力 薄 弱 ;是 单项 知识 没 掌握 ,还 是 综合 运用 所 学 知识 解决 实际 
问题 的 能 力 不 强 ,仔细 分 析 其 出 错 原因 , 有 助 于 教师 及 时 调控 教学 
策略 和 方法 。 另外 , 低 年 级 可 能 需要 在 规范 审题 . 解 题 、 作 图 等 方面 
进行 引导 。 

最 后 应 简要 小 结 测验 的 效果 与 下 一 单元 的 教学 基础 ,以 及 需要 
注意 的 问题 。 

具体 操作 可 以 参照 表 5 -8 的 模式 进行 ,这 里 以 人 教 版 九 年 级 数 
学 第 22 章 一 元 二 次 方程 单元 测验 为 示例 简要 说 明 。 


己 ] 














tl 
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表 5-8 九 年 级 上 学 期 数学 一 元 二 次 方程 单元 测验 分 析 报 告 



























































撰写 人 (教师 ) ; 测验 时 间 ， 撰写 时 间 : 
第 一 部 分 :学 习 内 容 与 考查 内 容 
学 习 内 容 考查 内 容 与 承载 的 试题 | 分 数 比例 
1. 对 一 元 二 次 方程 
的 认识 . 
2. 一 元 二 次 方程 的 
; 解法 : 
知识 点 | 。 配方 法 .公式 法 、 
因 式 分 解法 
本 单 3. 实际 问题 与 一 元 
A 二 次 方程 
1. 配方 的 基本 步 台 
与 技巧 
主要 技能 
2. 求 根 公式 的 使 用 
特点 与 要 求 
ee 
方 关 | 降 次 ,化 归 
第 二 部 分 :班级 整体 成 绩 
班级 ， 班级 总 人 数 ， “| 实 考 人 数 ， 缺 考 人 数 
平均 分 ， 中 位 数 ， 难度 ， 标准 差 ， 
1 
全 班 测验 成 绩 茎 时 图 
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( 续 表 ) 





第 三 部 分 : 题 组 答题 分 析 

















第 一 大 是 第 二 大 是 第 三 大 是 
(如 :选择 题 ) | (如 :填空 题 ) | (如 :解答 题 ) 
平均 分 
难度 
标准 差 
简要 评析 











第 四 部 分 :试题 答题 分 析 


最 优 (最 有 创意 ) 的 试 
题解 答 及 其 分 析 


典型 错误 、 错 误 最 多 的 
试题 及 其 错 因 分 析 


第 五 部 分 :小 结 














关于 教 法 
对 本 单元 教 
学 的 评价 关于 指导 学 生 








机 关于 教 法 


对 下 单元 教学 
胸 央 未 关于 指导 学 生 











2. 学 生 撰写 部 分 

测验 的 核心 目的 之 一 是 帮助 学 生 认 识 自 己 某 单元 知识 的 学 习 
状况 ,使 学 生 能 诊断 出 学 习 中 的 薄弱 环节 ,以 便 及 时 查 漏 补缺 ,明确 
下 一 阶段 的 努力 方向 ,因此 ,每 次 单元 测验 后 组 织 学 生 扎 写 单元 测 
验 分 析 是 一 种 很 好 的 学 习 方法 。 

学 生 撰写 单元 测验 分 析 时 ,可 以 从 本 单元 知识 掌握 情况 、 错 因 
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分 析 . 下 阶段 学 习 目标 等 几 个 方面 展开 。 

本 单元 知识 掌握 情况 分 析 帮 助 学 生 认 清 自己 学 习 的 整体 状态 ， 
哪些 内 容 掌握 得 好 ,哪些 内 容 掌握 得 不 好 ,客观 地 评价 自我 。 

如 果 测 验 没有 得 到 满分 ,说 明 该 单元 学 习 有 一 些 问题 需要 引起 
注意 。 错 因 分 析 部 分 引导 学 生 进行 自我 诊断 ,具体 反思 答题 错误 是 
由 智力 因素 引起 还 是 非 智 力 因 素 引 起 ,通过 自我 评价 来 端正 学 习 态 
度 .改进 学 习 方法 、 提 高 学 习 效率 ,达到 自我 教育 的 效果 。 

分 析 完 出 错 原因 后 ,最 好 让 学 生 衡量 自己 的 实际 水 平 与 测验 分 
数 之 间 的 差距 ,明确 自己 是 超 水 平 发 挥 或 是 发 挥 失 常 ,通过 这 种 诊 
断 ,让 学 生 看 到 自己 可 能 达到 的 目标 ,制定 学 习 的 近期 与 远 期 目标 ， 
养 成 恨 好 的 自我 规划 的 习惯 。 

当 学 生 通过 对 试卷 的 系统 分 析 、 总 结 . 反 思 后 ,他 们 意识 到 了 自 
已 存在 的 问题 和 不 足 。 此 时 ,教师 应 引导 他 们 根据 自身 情况 订 出 提 
高 成 绩 的 措施 和 方案 ,为 下 一 阶段 的 学 习 拟定 目标 和 策略 。 

为 了 引导 学 生 更 有 效 地 完成 测验 后 的 反思 ,具体 操作 可 以 参照 
表 5 -9 的 模式 进行 ,这 里 还 是 以 人 教 版 九 年 级 数学 第 22 章 一 元 二 
次 方程 单元 测验 为 示例 简要 说 明 。 

表 5-9 九 年 级 上 学 期 数学 一 元 二 次 方程 单元 测验 后 的 反思 报告 

撰写 人 (学 生 ): 测验 时 间 ， 撰写 时 间 ， 

















第 一 部 分 :本 单元 知识 掌握 情况 
知识 点 承载 试题 题 号 | 分 值 小 计 | 实 得 分 数 得 分 率 

1. 一 元 二 次 方程 的 概念 

2， 用 配方 法 解 一 元 二 次 方程 

， 用 公式 法 解 一 元 二 次 方程 

.用 因 式 分 解法 解 一 元 二 次 方程 

5. 根 的 判别 式 

6. 根 与 系数 的 关系 














名 





A 
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( 续 表 ) 
7, 运用 一 元 二 次 方程 解 应 用 题 
第 二 部 分 : 错 因 分 析 








主要 错误 原因 (每 题 限 选 至 多 3 项 ) 


出 错 斌 
题 题 号 | 完全 | 知识 | 审题 | 概念 | 推理 | 计算 | 公式 | 格式 | 表达 不 | 来 不 
出 错 | 用 错 | 出 错 | 规范 | 及 做 





进 忘 | 出 错 | 错 误 | 出 错 其 他 












































Si 








自 编 类 似 试题 与 解答 ， 








第 三 部 分 :小 结 (知识 掌握 情况 ,学 习 方 法 使 用 情况 ,疑难 与 困 感 .下 阶段 学 
习 目 标 、 具 体 措施 等 








值得 肯定 部 分 | 2 


对 本 单元 学 3 
习 的 评价 : 1 











学 习 薄弱 部 分 | 2 








知识 掌握 方面 
学 习 方 法 方面 


具体 措施 
0 


在 实际 教学 实践 中 ,如 果 能 够 长 期 引导 学 生 填写 表 5 - 9, 还 可 








下 单元 学 
习 目 标 
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以 发 现 学 生 在 学 习 态度 ,学习 方法 .学 习习 惯 等 方面 存在 的 问题 ,更 
有 利于 教师 针对 性 地 开展 教学 。 


二 、 学 期 测验 


学 期 测验 往往 指 的 是 一 个 学 期 结束 时 的 测试 ,通常 由 学 校 安排 
统一 考试 时 间 , 全 年 级 学 生 在 规定 的 时 间 内 完成 相应 科目 的 测验 ; 
测验 结束 后 ,由 全 年 级 的 教师 分 科 统一 阅卷 ;阅卷 结束 后 ,汇总 所 有 
数据 ,并 统一 进行 试卷 分 析 ; 在 此 基础 上 ,各 班 科 任教 师 形成 所 任 班 
级 的 试卷 分 析 报告 ,并 把 测验 情况 反馈 给 学 生 。 

学 期 测验 的 功能 主要 包括 两 个 方面 :一 方面 是 检测 某 学 期 整体 
学 与 教 的 状况 ,关注 的 是 年 级 整体 的 学 与 教 的 水 平 ; 另 一 方面 ,也 比 
较 各 个 班级 的 教学 情况 ,以 便 进行 教学 评价 。 相 应 地 ,学 期 测验 后 
的 试卷 分 析 除了 关注 该 学 期 学 科教 学 的 处 理 与 掌握 情况 外 ,还 需要 
进行 班级 之 间 的 教学 情况 对 比分 析 。 因 此 ,学 期 测验 分 析 报 告 应 由 
年 级 学 科 备课 组 的 教师 共同 完成 。 

学 期 测验 试卷 分 析 报 告 主要 包括 考查 内 容 分 布 . 年 级 整体 测验 
情况 分 析 、 各 个 班级 测验 成 绩 分 析 、 题 组 整体 测验 情况 分 析 、 试 题 测 
验 情况 分 析 ,小 结 等 六 部 分 内 容 。 

考查 内 容 分 布 分 析 着 重 突出 一 个 学 期 所 学 各 章 内 容 的 考查 结构 、 
知识 点 分 布 ,知识 ,技能 和 思想 方法 的 考查 重点 ,并 检查 测验 内 容 的 覆 
盖 率 ,确保 基于 该 学 期 测验 的 分 析 具 有 较 好 的 可 靠 性 与 有 效 性 。 

虽然 学 期 测验 属于 标准 参照 考试 ,区 分 度 不 需要 过 度 强调 ,但 
于 样本 较 大 (一 个 年 级 的 学 生 往往 有 数 百 人 ,检验 试题 的 区 分 度 
还 是 必要 的 ;另外 ,学 期 测验 对 测验 信 度 与 结构 效 度 的 要 求 也 相应 
高 于 单元 测验 ,因此 ,也 应 提供 相应 的 测验 卷 的 信 度 与 效 度 指标 。 由 
于 年 级 总 人 数 较 多 ,建议 用 EXCEL 或 SPSS 软件 制作 给 出 学 期 测验 成 
绩 的 频数 分 布 直方 图 ,以 方便 学 生 了 解 自己 在 年 级 中 所 处 的 位 置 。 

在 统计 各 个 班级 的 测验 成 绩 时 ,除了 公布 本 次 测验 的 平均 分 
外 ,还 应 公布 入 学 分 班 时 每 个 班 的 平均 成 绩 。 为 了 规范 体现 班级 之 
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间 的 差异 ,应 运用 单 因素 方差 分 析 法 分 别 检验 每 次 测验 后 班级 平均 
分 之 间 的 差异 是 否 显著 (具体 方法 请 参考 第 四 章 例 4- 11)。 由 于 班 
级 之 间 的 平均 分 往往 有 波动 ,波动 是 否 在 正常 范围 内 ,应 使 用 x 检 
验 进行 显著 性 分 析 。 给 出 各 个 统计 指标 的 数值 后 ,应 简要 分 析 统 计 
量 的 实际 意义 ,以 方便 师 生 阅读 与 理解 。 

在 分 析 题 组 情况 时 ,只 需要 基于 全 年 级 的 整体 水 平 详细 汇报 每 
道 题 与 每 个 题 组 的 常规 量化 指标 ,而 基于 每 个 班级 的 相应 每 道 题 、 
每 个 题 组 的 常规 量化 指标 由 各 个 科 任教 师 完成 ,不 体现 在 全 年 级 学 
期 测验 分 析 报 告 中 。 

试题 分 析 部 分 应 逐 题 展开 ,这 样 为 每 个 班 的 试题 分 析 提 供 参照 。 

最 后 应 简要 小 结 学 期 测验 的 预测 目标 与 实际 效果 的 吻合 度 ,下 
个 学 期 的 教学 基础 与 需要 注意 的 问题 。 

具体 操作 可 以 参照 表 5 - 10 的 模式 进行 ,这 里 以 人 教 版 九 年 级 























上 学 期 数学 期 末 测 验 为 示例 简要 说 明 。 
表 5 - 10 九 年 级 上 学 期 数学 期 末 调 验 分 析 报告 
撰写 人 (备课 组 ) : 测验 时 间 ， 撰写 时 间 ， 









第 一 部 分 :考查 内 容 
教学 时 数 分 配 | 考查 内 容 分 配 差异 比较 
课时 数 | 课时 比例 | 分 值 | 百分比 | 比例 差 | x 检 验 



































a = | 
第 22 章 一 元 
2 13 21% 
二 次 方程 
期 | 第 23 章 旋转 | 8 | 13% 
和 第 24 章 加 17 | 28% 
Se 概率 | 14 23% 
小 计 61 100% | 缀 
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( 续 表 ) 





第 二 部 分 :全 年 级 成 绩 统计 






































”年级 总 人 数 : | 实 考 人 数 : | 缺 考 和 人数: 

平均 分 ， 最 高 分 ， | 最 低 分 : 标准 差 : 

难度 信 度 ， | 效 度 ， 区 分 度 ， 

全 年 级 测验 成 绩 

频数 分 布 直方 

第 三 部 分 ;各 个 班级 测验 成 绩 统计 

入 学 分 班 (或 上 次 测验 ) 情 况 | 。 本 次 测验 情况 差异 比较 

人 [a | 平分 让 均 分 的 分 差 | 排名 益 | 她 检验 





平均 分 | 排名 差异 检验 站 均 分 | 排名 差异 检验 








\ 二 





3 














4 
第 四 部 分 : 题 组 答题 分 析 


















































平均 分 中 难度 标准 差 区 分 度 
| 1 lt 医 
第 2 题 | 全 
第 一 大 题 | …… J 
第 8 题 风 
小 计 - 
第 9 题 | | 
第 10 题 
第 三 类 题 | .…… 
第 14 题 
水 守 | 
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简要 评析 

第 五 部 分 :试题 答题 情况 分 析 

题 号 - 分析 内 容 
考查 要 点 

最 优 解 答 
典型 错误 

对 教学 的 启示 
考查 要 点 

最 优 解答 
典型 错误 
对 教学 的 启示 





























考查 要 点 
最 优 解答 
典型 错误 
对 教学 的 启示 | 
第 六 部 分 :小 结 























本 学 期 全 年 级 教 | 优点 : 
学 情况 总 体 评价 不足。 








下 个 学 期 全 年 级 | 目标 * 
教学 目标 规划 措施 : 
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除了 年 级 备课 组 给 出 学 期 测验 的 试卷 总 体 分 析 报 告 外 ,各 个 班 
级 的 科 任 教师 还 需要 结合 任教 班级 的 考生 答题 情况 进行 针对 性 分 
析 , 在 此 基础 上 组 织 全 班 学 生 进 行 试卷 分 析 , 上 好 测验 讲评 课 。 

学 期 测验 中 ,学生 同 样 需要 撰写 相应 的 测验 分 析 或 反思 。 学 生 
撰写 学 期 测验 分 析 时 ,可 以 借助 单元 测验 的 分 析 模式 进行 ,这 里 不 
再 歼 述 。 


三 、 联 考 或 统考 


联 考 即 联合 考试 , 它 存在 多 种 组 织 形式 ,常见 的 主要 有 两 种 : 教 
学 水 平 相 当 的 校 与 校 之 间 民 间 性 质 的 联 考 ,区 与 区 之 间 的 半 官 方 性 
质 联 考 。 统 考 即 统一 考试 , 它 具有 官方 性 质 ,往往 由 有 关 教 育 行政 
部 门 组 织 进行 。 此 处 主要 探讨 具有 官方 性 质 的 联 考 与 统考 的 试卷 
分 析 报告 的 撰写 特征 。 

联 考 与 统考 的 命题 工作 都 由 专业 人 员 完 成 ,这 类 考试 既 具 有 标 
准 参照 测验 的 性 质 ,也 兼顾 常 模 参照 测验 的 特征 ; 施 测 后 的 分 析 既 
关注 本 校 学 生 的 答题 情况 ,又 涉及 跨 校 或 跨 区 域 的 成 绩 比 较 研究 。 
因此 ,撰写 联 考 与 统考 的 试卷 分 析 报 告 时 ,与 前 述 单元 测验 、 学 期 测 
验 的 侧重 点 有 较 大 不 同 。 

联 考 与 统考 的 试卷 分 析 报 告 应 包括 试卷 质量 分 析 ,试题 质量 分 
析 、 考 生 总 体 测验 成 绩 统计 与 答题 情况 分 析 和 不 同 区 域 (学 校 ) 测 验 
成 绩 对 比分 析 等 内 容 。 

试卷 质量 分 析 包 括 测 验 目的 定位 准确 性 分 析 、 考 查 内 容 有 效 性 
分 析 、 测 验 结果 可 靠 性 分 析 、 试 卷 编排 合理 性 分 析 、 评 分 标准 制定 与 
实施 的 确切 性 分 析 等 部 分 ,每 部 分 的 量化 指标 计算 、 定 性 分 析 方 法 
具体 可 以 参考 第 二 章 相关 内 容 。 

试题 质量 分 析 包 括 试题 编写 的 科学 性 与 规范 性 分 析 、 试 题 的 难 
易 度 分 析 ,试题 的 鉴别 力 分 析 答题 的 典型 错 例 分 析 、 对 教学 的 指导 
作用 等 部 分 ,具体 可 以 参照 第 二 章 相关 内 容 进 行 研究 。 

考生 总 体 测验 成 绩 统计 与 答题 情况 分 析 包括 测验 成 绩 分 布 状 
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况 、 测 验 分 数 的 组 织 与 概括 、 基 于 测验 分 数 进行 的 统计 推断 、 考 生 卷 
面 答题 情况 的 质 性 分 析 等 方面 ,具体 可 以 参照 第 三 .四 章 的 相关 内 
容 ,也 可 以 参照 单元 测验 .学 期 测验 的 相关 部 分 分 析 。 

不 同 区 域 ( 学 校 ) 测 验 成 绩 对 比分 析 应 关注 多 个 侧面 .多 个 层 
次 ,力求 客观 、 全 方位 地 反映 不 同 区 域 (学 校 ) 的 教学 面貌, 为 下 阶段 
的 教学 与 管理 提供 坚实 依据 。 

下 面 以 某 市 某 五 个 区 域 联 考 数 学 测验 成 绩 为 例 ,简要 介绍 对 不 
同 区 域 测验 成 绩 进行 比较 的 常见 方法 。 

表 5-11 某 五 区 联 考 数学 测验 成 绩 统 计 











可 





































区 分 度 | 前 1/3 平均 分 | 后 1/3 平均 分 及 格 率 





119. 69 32.82 | 42.13 





124. 32 35. 59 47, 25 





135. 01 37. 32 59. 18 





44. 43 62. 41 















50, 46 A 





从 表 5 -11 中 ,不 仅 可 以 了 解 每 个 区 域 的 整体 状况 ,还 可 以 了 解 
按照 考生 分 数 平均 分 成 三 段 的 前 后 两 段 考生 的 平均 分 和 及 格 率 状 
况 , 根 据 表 5 -11 还 可 以 制作 平均 分 分 布 折 线 图 ,如 图 5 - 5, 以 更 形 


分 值 
150 


0 一 一 一 | FF 









































一 各 一 前 1/3 平 均 分 
0 5 -全 后 113 平 均 分 
3 i 
0 , J = 
A B La D E 区域 


图 5-5 某 五 区 联 考 教学 测验 三 类 平均 成 绩 折 线 统计 图 
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象 地 反映 各 个 区 域 的 测验 成 绩 。 其 中 区 域 C 的 标准 差 .区 分 度 等 两 
个 指标 值 都 最 大 ,虽然 前 1/3 平均 分 高 于 区 域 D, 但 由 于 后 1/3 平均 
分 低 于 区 域 D 很 多 ,因此 总 平均 分 明显 低 于 区 域 D, 这 说 明 区 域 C 
学 校 间 ,学生 间 两 极 分 化 现象 明显 ,需要 给 予 高 度 关 注 。 

表 5-12 某 五 区 联 考 数学 测验 高 分 段 (前 10% ) 测 验 成 绩 统计 






























































_ | 学校 | 学 生 学 校 分 布 学 生 分 布 
区 域 | 总 数 | 总 数 | 学 校 数 | 占 所 属 区 总 数 比例 | 学 生 数 | 占 所 属 区 总 数 比例 
A 25 9201 10 40. 00% 20 0.22% 
B 11 2551 1 | 9.09% 1 中 0.04% 
[ee 51 | 8904 14 27. 50% 127 1.43% 
D 33 8371 区 | 48. 48% | 123 1.47% 
E 37 12607 31 83.78% | 456 3.62% 
小 计 | 157 | 41634 | 72 45. 86% 727 1.75% 








表 5-12 统 计 显示 ,虽然 区 域 A 的 三 项 平均 分 指标 都 明显 仿 
低 , 但 优等 生 比 例 强 于 区 域 B, 而 且 全 区 40% 的 学 校 都 有 成 绩 拨 
尖 的 学 生 , 如 何 发 挥 优等 生 的 榜样 作用 ,需要 深入 研究 .区域 B 
的 优生 培养 比较 薄弱 ,需要 重点 突破 .区 域 C 的 优生 非常 集中 ， 
虽然 优生 总 人 数 不 少 ,但 是 分 布 的 学 校 较为 集中 ,体现 出 学 校 之 
间 的 明显 差异 。 区 域 EE 优生 人 数 多 且 分 散 ,全 区 83.78% 的 学 校 
都 有 优生 领跑 ,再 加 上 学 困 生 人 数 比例 相对 较 小 ,因此 ,整体 优 
势 非常 明显 。 

表 5 -13 统计 显示 ,区 域 C 教 学 质量 薄弱 学 校 所 占 比例 最 大 ， 
在 32 所 学 校 中 比例 高 达 59. 38%1! 而 同时 教学 质量 良好 的 学 校 
所 占 比 例 相 对 而 言 差异 不 算 太 大 。 其 次 ,区 域 A 教学 质量 薄弱 学 
校 所 占 比 例 不 容 乐 观 , 需 要 具体 问题 具体 分 析 。 总 体 而 言 ,区 域 
的 教学 质量 良好 的 学 校 多 ,而 教学 质量 薄弱 的 学 校 几乎 没有 ,整体 
优势 明显 。 

另外 ,还 可 以 用 单 因素 方差 分 析 法 具体 比较 区 域内 学 校 与 学 校 
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表 5-13 平均 成 绩 排 名 前 20% .后 20% 学 校 在 五 区 分 布 统计 
前 20% 后 20% 


校 
区 域 | 总 数 | 前 10%| 百分比 | 前 20%| 百分比 | 后 10%| 百分比 | 后 2096| 百 分 比 
(%) | 学 校 数 (%) | 学 校 数 | (%) 


12.50 8 25. 00 



















12.50 3 9. 38 





62. 50 19 59, 38 





12. 50 2 6. 25 



































间 平 均 分 的 差异 、 区 域 与 区 域 间 平 均 分 的 差异 ,比较 方法 参见 第 四 
章 第 三 节 ,这 里 不 再 歼 述 。 
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虽然 经 典 测量 理论 在 心理 与 教育 测量 中 得 到 广泛 应 用 ,其 作 
和 地 位 越 来 越 显 著 , 但 是 ,经 典 测量 理论 的 先天 不 足 也 极 大 地 困扰 
着 使 用 者 ,该 理论 的 局 限 性 日 益 突出 。 一 些 测验 研究 者 从 深入 分 析 
测验 误差 的 来 源 和 结构 出 发 ,应 用 方差 分 量 分 析 方 法 来 辅助 测验 如 
究 , 在 经 典 真 分 数理 论 的 基础 上 创建 了 从 宏观 上 研究 测验 性 质 的 新 
理论 一 一 概 化 理论 。 














第 一 节 概 化 理论 对 经 典 真 
分 数理 论 的 拓展 


经 典 真 分 数理 论 把 实测 分 数 简单 地 划分 为 真 分 数 和 误差 分 数 
(X 二 TT 十 EE), 并且 把 误差 分 数 看 成 是 随机 误差 ,对 不 同 来 源 的 误差 
分 数 不 做 进一步 的 分 解 与 探讨 。 概 化 理论 认为 测量 误差 中 既 有 系 
统 误差 ,也 有 随机 误差 ,并 从 *“ 测 什么 ”与 “怎么 测 ” 的 角度 具体 界定 
测量 目标 ,影响 和 制约 测量 目标 的 各 种 因素 、 测 量 分 数 .影响 和 制约 
测量 分 数 的 各 种 因素 ,然后 运用 方差 分 析 法 同时 讨论 各 种 因素 可 能 
产生 的 误差 对 测量 结果 的 影响 。 

经 典 真 分 数理 论 一 般 假 设 考生 总 体 的 能 力 状况 服从 正 态 分 布 ， 
进行 测验 时 强调 根据 随机 抽样 理论 选取 考生 样本 ,强调 样本 选取 的 
代表 性 。 概 化 理论 也 认为 测验 要 观察 的 考生 一 般 均 抽样 来 自 某 一 
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个 总 体 , 但 对 考生 总 体 的 分 布 没有 明确 的 规定 。 

经 典 真 分 数理 论 假定 平行 测验 测量 的 是 同一 种 能 力 , 因 此 所 有 
平行 测验 的 平均 分 ,方差 与 协 方差 等 均 相 等 。 概 化 理论 则 将 一 份 测 
验 试卷 看 作 是 一 个 由 无 数 道 试题 组 成 的 全 域 ( 区 别 于 测量 对 象 的 总 
体 ) 的 一 个 样本 ,只 要 两 份 测验 卷 是 从 同一 个 试题 全 域 中 随机 抽 得 
的 ,所 构成 的 测验 就 是 平行 测验 。 

经 典 真 分 数理 论 是 在 施 测 后 分 析 数 据 ,确定 误差 值 的 大 小 ,并 
进行 相关 的 分 析 。 概 化 理论 则 提出 * 先 概括 .后 决策 ”的 两 步 工作 方 
法 , 先 在 一 定 的 测量 条 件 下 设计 并 进行 试验 性 的 测试 ,按照 试 测 所 
得 的 数据 估计 各 种 来 源 的 方差 分 量 , 然 后 再 根据 相应 方差 分 量 决 定 
的 指标 去 考查 : 当 改 变 测 量 条 件 的 某 些 方面 时 会 出 现 何 种 结果 , 据 
此 加 以 判断 ,做 出 今后 应 如 何 去 控 制 改 进 测量 精度 的 优化 决策 。 

概 化 理论 与 经 典 真 分 数理 论 的 关系 可 以 用 下 面 的 框图 简单 


概括 。 
方差 分 析 方 法 


ni i 
























































第 二 节 概 化 理论 的 基本 概念 


概 化 理论 在 突破 与 拓展 经 典 真 分 数理 论 时 形成 了 一 系列 的 概 
念 .原理 与 方法 ,构成 该 理论 的 基本 体系 。 以 下 基本 概念 是 理解 概 
化 理论 的 基础 ,下 面 结合 教育 测验 加 以 介绍 。 

1. 测量 侧面 .侧面 水 平 与 观察 全 域 

教育 测验 的 根本 目的 是 推测 考生 具备 的 知识 与 技能 、 方 法 与 能 
力 的 程度 ,因此 ,测验 研究 的 对 象 就 是 考生 。 然而 ,考生 在 测验 中 获 
得 分 数 的 高 低 , 除 了 决定 于 其 自身 对 知识 技能 方法 的 掌握 情况 .个 
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人 能 力 的 高 低 外 ,还 会 受到 许多 其 他 因素 影响 ,如 试题 的 难度 是 否 
与 考生 的 能 力 匹配 测验 时 间 的 规定 是 否 恰 当 、 评 分 标准 的 制定 是 
否 合理 .评分 教师 对 评分 标准 的 把 握 是 否 一 致 ,等 等 。 在 开展 研究 














时 ,如 果 把 考生 组 的 某 种 能 力 看 成 测量 目标 ,那么 ,影响 和 制约 考生 
发 挥 真实 水 平 的 各 种 因素 就 称 为 测量 侧面 ,每 个 影响 因素 称 为 一 











人 ~ 








侧面 ,如 ,试题 侧面 、 测 验 时 间 侧 面 、 评 分 标准 侧面 、 评 分 教师 侧面 ， 











等 等 。 


一 个 侧面 可 以 有 不 同 的 水 平 。 例 如 ,在 试题 侧面 中 ,如 果 一 份 
测验 卷 由 n 道 试题 构成 ,那么 这 道 试题 就 代表 了 试题 侧面 的 n 个 
水 平 ;在 评分 教师 侧面 中 ,如 果 有 两 名 教师 参加 阅卷 ,那么 这 两 名 教 














师 就 代表 评分 教师 的 2 个 水 平 。 





测量 侧面 还 有 随机 侧面 与 同 定 侧面 之 分 。 随 机 侧面 是 指 该 侧 
所 有 
水 平 中 随机 抽取 的 一 个 样本 。 例 如 ,在 数学 测验 中 ,可 以 将 试题 全 
面 的 
一 个 样本 ,测验 卷 中 的 试题 数 就 是 该 随机 侧面 的 水 平 数 。 周 定 侧 
目的 




















面 的 水 平 数 是 无 限 的 ,在 测量 分 析 中 所 使 用 的 水 平 是 从 该 侧面 

















面 看 成 是 随机 侧面 ,一 次 测验 所 使 用 的 测验 卷 就 构成 该 随机 例 


是 指 该 侧面 的 水 平 数 是 一 个 确定 值 ( 如 a) ,在 测量 分 析 中 所 使 











面 











水 平 就 是 这 a 个 水 平 。 例 如 ,在 数学 测验 中 ,可 以 将 测验 内 














质 、 简 单 应 用 ,与 方程 不 等 式 结合 的 综合 应 用 ”等 知识 ,那么 i 
侧面 就 分 为 这 4 个 水 平 。 


























测量 侧面 ,测量 中 可 能 存在 的 测量 侧面 的 全 体 就 构成 测量 
体 , 称 为 观察 全 域 。 
2. 概 化 研究 








概 化 理论 认为 各 个 测量 侧面 是 测量 误差 的 来 源 。 例 如 , 考 4 
在 一 次 数学 测验 中 获得 78 分 ,那么 影响 考生 A 得 分 的 主要 侧面 有 ， 























容 
看 成 是 固定 侧面 ,如 果 一 次 测验 只 涉及 “一 次 函数 的 概念 .图 象 与 1 
该 





由 于 测验 总 是 在 一 定 条 件 下 进行 的 ,因而 总 是 存在 一 定数 量 的 
侧 


EA 


考生 A 在 相应 考查 内 容 上 的 实际 数学 能 力 , 试 题 设计 ,评分 教师 对 
评分 标准 的 把 握 等 ,可 能 还 有 更 多 的 测量 侧面 需要 研究 。 为 了 确定 
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不 同 测量 侧面 对 考生 分 数 的 影响 效应 ,需要 确定 不 同 侧面 效应 的 方 
差 , 这 种 不 同 侧面 方差 就 成 为 方差 分 量 。 

概 化 研究 就 是 根据 测量 目的 与 用 途 , 先 确定 测量 目标 与 测量 侧 
面 的 结构 ,再 设计 收集 资料 的 方案 ,根据 设计 方案 进行 试验 性 测试 ， 
以 调查 各 个 侧面 的 采样 对 考生 测验 分 数 的 影响 ,并 提供 尽 可 能 多 的 
测量 误差 来 源 的 信息 , 即 确定 各 个 侧面 方差 分 量 的 大 小 。 

概 化 研究 把 观测 分 数 的 总 体 方差 分 解 成 测量 目标 方差 不同 测 
量 侧 面 方差 、 测 量 目标 与 测量 侧面 交互 作用 方差 ,不同 测 量 侧面 交 
互 作 用 方差 ,交互 作用 与 其 他 不 明 变异 来 源 混杂 效应 的 残 差 方差 等 
部 分 ,其 一 项 主要 任务 就 是 用 方差 分 析 等 方法 来 估 出 各 方差 分 量 的 
告 计 值 , 这 种 估计 值 应 反映 出 观察 全 域 中 可 能 存在 且 又 可 以 实际 观 
察 的 各 种 影响 因素 (侧面 ) 所 造成 的 方差 。 

3， 拓 广 全 域 

概 化 理论 通过 对 观察 全 域 中 各 个 测量 侧面 进行 概 化 研究 ,来 发 
现 观察 全 域 中 可 能 存在 的 问题 ,从 而 提出 对 观察 全 域 的 有 关 侧 面 的 
修改 方案 ,以 形成 一 个 新 的 全 域 , 这 个 新 的 全 域 就 是 拓 广 全 域 (也 称 
作 概 化 全 域 ), 它 包括 研究 者 希望 把 研究 结果 推广 而 至 的 所 有 侧面 
数 及 其 每 个 侧面 的 相应 水 平 数 , 一 般 是 观察 全 域 的 子 集 。 

4. 决策 研究 

决策 研究 就 是 利用 概 化 研究 提供 的 信息 ,通过 增加 侧面 的 水 平 
数 、 将 侧面 固定 等 策略 ,寻找 减少 误差 .提高 测量 精度 的 良好 的 测验 
设计 ,使 得 某 个 或 某 些 侧 面 对 测 验 的 影响 或 误差 最 小 。 这 个 研究 过 
程 称 为 决策 。 

根据 研究 者 对 测验 结果 作出 处 理 的 方式 来 划分 ,决策 分 为 相对 
决策 和 绝对 决策 两 种 。 相 对 决策 是 指 把 某 一 考生 的 分 数 与 其 他 考 
生 进 行 比较 而 做 出 决策 ,例如 , 常 模 参照 测验 的 结果 解释 。 绝 对决 
策 是 指 把 考生 的 答题 情况 与 教育 、 教 学 的 客观 标准 进行 比较 而 做 出 
决策 ,例如 ,标准 参照 测验 的 结果 解释 。 
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第 三 节 ” 概 化 理论 的 基本 原理 


1. 概 化 理论 分 析 流 程 图 

运用 概 化 理论 研究 测验 时 ,研究 过 程 分 为 依次 进行 的 概 化 录 
究 、 决 策 研究 两 步 。 概 化 研究 就 是 定量 估计 观察 全 域 中 测量 目标 、 
测量 侧面 等 形成 的 各 种 测量 误差 方差 ,为 决策 研究 提供 分 析 数 据 。 
决策 研究 就 是 利用 概 化 研究 所 获 结论 ,去 考察 如 何 提高 测量 精度 ， 
从 而 作出 优化 决策 ,实现 预 控 调节 。 

概 化 理论 研究 分 析 过 程 的 流程 图 如 下 。 









































采 半 于 六 李 半 全 





概 化 研究 
拓 广 全 域 1 真 分 数 方差 与 | | 概 化 系数 或 拓 广 全 域 1 
的 决策 研究 | | 误差 分 数 方差 | | 可靠 性 系数 的 分 数 信 度 | 


拓 广 全 域 2 真 分 数 方差 与 | 。 | 概 化 系数 或 拓 广 全 域 2 















的 决策 研究 | | 误差 分 数 方差 | | 可靠 性 系数 的 分 数 信 度 


拓 广 全 域 n 


: 的 分 数 信和 度 | | [而 而 
拓 广 全 域 | .| 真 分 数 方差 与 | | 概 化 系数 或 || ,| 搞 广 全 碱 ” | | 【测验 方案 
的 决策 研究 | “| 误差 分 数 方差 "| 可 靠 性 系数 | “| 的 分 数 效 度 


决策 研究 


2. 概 化 研究 阶段 收集 测验 数据 方案 的 设计 
数据 收集 方案 的 设计 类 型 包括 交叉 设计 、 伐 套 设 计 和 交叉 与 拒 
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套 混合 设计 三 大 类 型 。 
交叉 设计 是 指 ,根据 测量 目的 确定 出 所 有 的 测量 目标 与 测量 侧 
面 ,每 个 测量 目标 在 每 个 测量 侧面 的 所 有 水 平 上 均 被 测量 ,所 有 类 型 
的 测量 数据 都 被 收集 。 教 育 测验 中 常见 的 交叉 设计 主要 有 单 侧面 设 
计 , 两 侧面 设计 两 种 。 例 如 , 某 市 某 年 中 考 的 单 侧面 交叉 设计 要 求 所 
有 考生 应 该 完成 所 有 试题 ,数据 收集 的 方式 可 以 用 s xX i 表示, 其中》 
代表 考生 数 ,i 代表 试题 数 , 见 表 1; 如 果 该 市 该 年 中 考 采 用 双 侧面 交叉 
设计 , 则 两 侧面 一 般 是 试题 和 评分 教师 ,要求 所 有 考生 均 完成 所 有 试题 ， 
同时 ,所 有 评分 教师 对 所 有 试题 进行 评分 ,数据 收集 的 方式 可 以 用 x 
iXj 表示 ,其 中 * 代表 考生 数 , 代表 试题 数 ,; 代表 评分 教师 数 , 见 表 2。 
表 1 单 侧面 交叉 设计 sX i 
试题 侧面 
试题 2 ee 试题 i 










































































收集 的 实测 分 数 












考生 1 zn 
考生 2 zu | ze | Za 











讲演 岂 魔 

























































嵌 套 设计 是 指 ,根据 测量 目的 确定 出 所 有 的 测量 目标 与 测量 侧 


面 ,然后 把 某 个 侧面 的 各 个 水 平分 别 包含 到 另 一 个 侧面 的 各 个 水 平 
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之 中 ,再 针对 性 地 收集 测量 数据 的 方法 。 教 育 测验 中 常见 的 奉 套 设 
计 主 要 有 单 侧面 嵌 套 设计 、 两 侧面 马 套 设计 两 种 。 例 如 , 某 市 某 年 
中 考 英 语 口语 的 单 侧面 找 套 设计 要 求 部 分 考生 完成 一 部 分 试题 , 另 
一 部 分 考生 完成 男 一 部 分 试题 ,数据 收集 的 方式 可 以 用 i: s 表示 ,其 
中 i 代表 试题 的 分 类 数 ,s 代表 每 部 分 试题 考生 数 , 当 i 二 2 上 且 s 一 3 
时 的 示例 见 表 3; 如 果 该 市 该 年 中 考 英语 口语 采用 双 侧 面 嵌 套 设计 ， 
同样 ,两 侧面 一 般 是 试题 和 评分 教师 ,要 求 所 有 考生 均 完成 所 有 试 
题 ,同时 ,部 分 评分 教师 对 部 分 试题 进行 评分 ,数据 收集 的 方式 可 以 
用 sX(i:) 表示 ,其 中 s 代表 考生 数 ,i 代表 试题 的 部 分 数 ,i 代表 评 
分 教师 数 , 当 s = 6, i 二 2, j 二 2 时 示例 见 表 4。 









































表 3 单 侧面 媒 套 设计 is 



































































收集 的 实测 分 数 
被 考生 2 Zn az 
试 考生 3 xy az 
总 考生 4 ea ET 
体 考生 5 Zs st 
考生 6 Zo Xo 
青 4 双 侧 面 嵌 套 设计 sX (i: j) 
评分 教师 1 评分 教师 2 
收集 的 实测 分 数 dd 
试题 1 试题 2 试题 3 试题 4 
考生 1 oa ai 
被 考生 2 Ta Zot 
试 考生 3 Za Tan 
总 考生 4 | az ha 
外 考生 5 saz st 
考生 6 Zeaz Zor 
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交叉 与 嵌 套 混合 设计 是 指 把 交叉 设计 、 嵌 套 设计 综合 使 用 的 一 
种 方法 , 它 一 般 用 于 有 三 个 测量 侧面 及 其 以 上 的 情况 。 

三 种 设计 类 型 中 ,交叉 设计 的 数据 信息 是 最 丰富 的 ,而 纯 嵌 套 
设计 的 数据 信息 是 最 简单 的 。 理 论 上 讲 , 设 计 的 测量 侧面 越 多 ,每 
个 侧面 涉及 的 水 平 数 越 多 ,那么 对 测验 的 分 析 就 越 完 善 ;但 是 ,对 于 
后 续 的 统计 分 析 而 言 , 困 难 就 会 越 大 ,甚至 可 能 无 法 进行 

收集 完 数据 进行 方差 分 析 时 , 可 以 借助 计算 机 统计 软件 , 如 
GLM、GENOVA、SAS 中 的 VARCOMP 等 进行 ,数据 处 理 较 为 
简便 。 

3. 决策 研究 阶段 的 研究 方法 简介 

决策 研究 阶段 ,首先 要 根据 概 化 研究 提供 的 各 种 来 源 误差 方差 
的 估计 值 ,在 原 设计 方案 收集 的 数据 范围 内 ,对 各 个 测量 侧面 做 出 
不 同 的 调整 ,得 到 一 些 拓 广 全 域 ,然后 形成 一 些 新 的 测验 方案 。 调 
整 方 法 主要 有 三 种 。 

方法 一 是 将 一 个 或 几 个 随机 侧面 改 为 固定 侧面 (至 少 保留 一 个 
随机 侧面 )。 例 如 ,研究 评分 教师 评分 的 信 度 时 ,可 以 将 试题 看 成 是 
固定 侧面 ,将 评分 教师 看 成 随机 侧面 ,研究 改变 评分 教师 数 和 评分 
教师 构成 等 对 测验 结果 的 影响 。 

方法 二 是 调整 一 个 或 几 个 测量 侧面 的 水 平 数 。 例 如 ,调整 试题 
数 ,或 调整 评分 教师 数 等 。 一 般 地 ,增加 水 平 数 意味 着 增加 测量 的 
重复 数 ,可 以 达到 提高 测量 精度 的 目的 。 

方法 三 是 改变 测量 数据 的 收集 方法 ,主要 是 把 交叉 设计 的 数据 
部 分 或 全 部 地 改 为 嵌 套 设计 ,达到 减少 投入 、 简 化 测量 的 目的 。 

对 于 变化 了 的 各 种 新 测验 方案 ,决策 研究 给 出 了 两 个 比较 优 劣 
的 误差 指标 :相对 误差 方差 与 绝对 误差 方差 。 在 误差 指标 的 基础 
上 ,又 进一步 给 出 了 测验 精度 的 两 个 综合 指标 : 概 化 系数 (用 于 衡量 
常 模 参 照 测验 质量 ) 与 可 靠 性 系数 (用 于 衡量 标准 参照 测验 质量 )。 
可 以 根据 这 些 指标 判定 测验 方案 的 质量 。 
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第 四 节 运用 概 化 理论 应 注意 的 问题 


就 目前 发 展 状况 来 看 ,运用 概 化 理论 分 析 测 验 行为 时 需要 注意 
以 下 问题 。 
1. 考生 样本 的 选取 应 具 代 表 性 ,以 确保 数据 分 析 的 可 靠 性 

应 用 概 化 理论 全 面 分 析 测 验 性 质 时 ,首先 需要 设计 测验 ,在 此 
基础 上 采集 测验 数据 ,分 析 各 种 测验 误差 方差 ,再 在 此 基础 上 分 析 
比较 各 种 可 能 的 测验 方案 ,从 而 优选 出 最 佳 的 新 测验 方案 。 因 此 ， 
概 化 理论 的 分 析 基 础 是 测验 数据 ,为 了 保证 概 化 分 析 结 果 的 可 靠 
性 ,必须 满足 样本 数据 的 代表 性 , 即 充分 保证 考生 样本 的 代表 性 。 

2 施 测 条 件 的 控制 应 注意 前 后 一 致 性 

任何 测量 都 依赖 于 特定 的 施 测 条 件 , 施 测 条 件 中 的 测量 目标 、 
测量 侧面 .测量 侧面 水 平 数 等 的 变化 都 会 引起 测验 误差 来 源 、 测 验 
误差 大 小 、 测 验 信和 度 等 的 变化 ,从 而 造成 测验 分 数 解释 范围 的 变化 ， 
因此 ,运用 概 化 理论 分 析 测 验 行为 与 测验 结果 时 ,应 尽量 保持 施 测 
条 件 的 前 后 一 致 性 。 

3， 测量 侧面 的 确定 应 兼顾 测验 组 织 实施 数据 统计 技术 等 
的 可 操作 性 

概 化 理论 的 重心 是 分 析 各 种 测量 误差 的 来 源 , 并 尽量 减 小 测量 
误差 。 从 理论 上 讲 , 测 量 侧面 和 测量 水 平 数 越 多 ,对 测验 的 分 析 就 
越 完善 。 然 而 ,测验 侧面 过 多 ,不 仅 会 有 施 测 组 织 和 实施 的 困难 ,后 
期 数据 统计 .数据 分 析 的 工作 量 也 会 过 大 ,其 至 可 能 导致 无 法 完成 
数据 分 析 工 作 。 因 此 ,在 进行 测验 设计 时 ,应 充分 考虑 测验 的 可 操 
作 性 ,以 确保 测验 实施 与 分 析 的 正常 进行 。 
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虽然 概 化 理论 对 经 典 真 分 数理 论 做 出 许多 改进 与 发 展 ,但 是 概 化 理 
论 所 使 用 的 测量 模型 与 经 典 真 分 数理 论 并 没有 质 的 不 同 , 它 所 探讨 的 还 
是 停留 在 外 部 条 件 对 考生 作答 的 种 种 影响 ,研究 的 是 如 何 控制 外 部 条 件 
造成 的 误差 来 源 问题 ,仍然 没有 把 考生 作答 情况 与 试题 测量 性 能 ,考生 
实际 能 力 有 机 地 结合 起 来 。 试 题 反 应 理论 则 克服 了 经 典 真 分 数理 论 . 概 
化 理论 的 这 一 不 足 , 另 辟 新 路 ,成 为 现代 测量 理论 中 最 具 代 表 性 的 一 种 。 














第 一 节 试题 反应 模型 的 3 个 基本 假设 


试题 反应 理论 建立 在 潜在 特质 理论 基础 之 上 。 考 试 ,测验 总 是 
要 考查 测量 人 的 某 种 内 部 心理 特性 ,如 智力 ,能力 等 ,由 于 所 要 考查 
的 对 象 都 不 是 直接 可 以 观察 到 的 ,因此 被 统称 为 潜在 特质 。 试 题 反 
应 理论 研究 的 是 ,这 种 潜在 特质 水 平 与 试题 特征 如 何 联合 起 来 共同 
决定 考生 在 该 试题 上 的 答对 概率 (简称 答对 率 ), 至 于 潜在 特质 的 心 
理 结构 或 特征 如 何 ,并 不 探讨 。 

为 了 从 数学 的 角度 刻画 试题 特征 、 潜 在 特质 水 平 与 试题 答对 率 
之 间 的 关系 ,试题 反应 模型 构建 出 试题 特征 曲线 及 其 相关 函数 模 
型 ,这 些 模型 的 构建 通常 需要 满足 以 下 3 个 基本 假设 .2 





四 于 向 英 主编 ,教育 测量 与 统计 ,郑州 大 学 出 版 社 2004 年 1 月 ,30 页 。 
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1. 潜在 特质 的 单 维 性 

即 考生 的 某 一 测验 结果 只 取决 于 一 种 潜在 特质 或 能 力 ,其 他 能 
力 的 影响 可 忽略 不 计 。 

2. 试题 解答 的 局 部 独立 性 

这 个 假设 包括 两 个 方面 ,一 是 考生 解答 某 道 试题 时 ,不 受 其 他 试 
题 的 影响 , 即 某 一 考生 整 份 测验 卷 的 答对 率 等 于 每 道 试题 答对 率 之 积 。 
二 是 考生 与 考生 之 间 在 进行 试题 解答 时 是 相互 独立 . 互 不 影响 的 。 

3， 数学 模型 的 恰当 性 

即 选 取 的 试题 反应 模型 应 与 测验 数据 之 间 的 拟 合 良 好 。 在 进 
行 试 题 分 析 之 前 ,必须 对 数学 模型 的 拟 合 度 进 行 统计 检验 。 




















第 二 节 试题 特征 曲线 与 试题 特征 函数 


一 般 而 言 ,一 道 编制 质量 良好 的 试题 应 体现 出 这 样 的 特征 : 考 
生 的 测验 总 分 越 高 ,考生 在 该 试题 的 答对 率 也 越 大 。 为 了 更 好 地 揭 
示 考 生 能 力 与 试题 特征 如 何 共同 确 定 试题 的 答对 率 , 美 国 著名 测量 
学 家 洛 德 用 考生 的 测验 总 分 作为 考生 能 力 水 平 9 值 ,以 9 为 自 变 量 ， 
考查 每 道 试题 在 每 个 9 值 上 考生 的 答对 率 ,并 描 点 连 线 得 出 试题 特 
征 曲线 ,发 现 试题 特征 曲线 是 一 条 中 心 对 称 的 S 形 曲 线 ,然后 用 到 
辑 斯 递 (Logistic) 函 数 来 描述 该 曲线 。 

逻辑 斯 递 函 数 的 表达 式 如 下 : 












































= 

其 中 ,P;(9) 是 能 力 水 平 为 86 的 考生 在 试题 i 上 的 答对 率 ,c; 是 
试题 i 的 猜测 度 ( 即 猜测 答对 的 概率 ) ,a; 是 试题 i 的 区 分 度 ,6; 是 试 
题 i 的 难度 。 

一 般 地 , 当 试 题 i 确定 后 ,该 试题 的 参数 a;、6b;、c; 就 变 成 定 值 ， 
函数 P,(9) 就 随 能 力 水 平 9 的 变化 而 变化 。 当 试题 不 同时 ,试题 参 


2 (1) 
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数 也 不 同 ,函数 式 (1) 也 不 同 。 函 数 式 (1) 对 应 的 曲线 形状 如 图 1 。 








图 1 试题 ;的 特征 曲线 


在 图 1 中 , 自 变量 9 表示 的 是 考生 的 某 种 潜在 特质 ,习惯 上 采 / 























标准 Z 分 数 表示 ,一 般 取 值 范围 为 (一 3, 3)。P,(9) 随 9 值 的 增 大 而 
增 大 ,其 图 象 位 于 两 条 平行 线 Pi(9) = c;，Pi(9) = 1 之 间 , 其 中 
Pi(9) = c; 表示 即使 是 能 力 水 平 极其 低下 的 考生 ,试题 答对 率 也 有 
cu 因此 称 “; 为 试题 的 猜测 度 , 显然 c; 越 小 越 好 ; P,(6) = 1 表示 当 
考生 的 能 力 水 平 越 来 越 高 时 , 试题 答对 率 越 来 越 接近 1。 试 题 特征 


线 的 拐点 是 { 驴 ， 工 5 ) , 它 也 是 曲线 的 中 心 对 称 点 ; 当 6b 值 增 大 


讨 ,曲线 向 右 平移 ,只 有 潜在 特质 9 高 的 考生 才能 在 新 试题 上 获得 相 
同 的 答对 率 , 因 此 , 称 & 是 试题 ; 的 难度 。 过 拐点 作 试题 特征 曲线 的 
切线 , 记 切 线 的 倾斜 角 为 a, 则 a = V2xtan ae, a 越 大 , 则 曲线 越 陡峭 ， 
说 明 9 在 值 附近 稍 有 变化 , 则 答对 率 差异 就 很 大 , 即 该 试题 把 5b 值 
附近 的 考生 进行 了 精细 区 分 ,这 就 是 称 a; 是 试题 i 的 区 分 度 的 含义 。 
根据 试题 特征 函数 , 人们 既 可 以 对 试题 的 质量 作出 评价 ,也 可 
以 估计 考生 在 某 一 试题 上 的 能 力 水 平 。 需 要 指出 的 是 ,试题 特征 函 
数 中 的 三 个 参数 a;、6;、c, 虽然 沿用 了 经 典 真 分 数理 论 中 的 名 称 , 但 
是 定义 的 角度 与 方式 有 了 质 的 变化 ,应 注意 区 分 。 
在 实际 应 用 中 ,有 些 试题 的 猜测 度 很 小 ,为 了 研究 的 方便 ,就 令 
< 一 0, 这 时 试题 特征 函数 中 的 参数 就 变 成 两 个 ,函数 式 (1) 就 简化 为 



































Pat) = (2) 


下 
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式 (2) 称 为 试题 的 双 参 数 模型 。 

还 有 些 测验 ,不仅 所 有 试题 的 猜测 度 很 小 ,可 以 忽略 不 计 , 而 且 
所 有 试题 的 区 分 度 也 彼此 接近 ,这 时 可 以 令 a; = 1, 式 (2) 可 以 进 一 
步 简化 为 如 下 形式 : 





Ne (3) 


I 二 ee 


式 (3) 称 为 试题 的 单 参数 模型 ,也 被 称 为 拉 希 (Rasch) 模 型 。 





第 三 节 试题 反应 模型 与 模型 
中 的 参数 估计 


试题 反应 理论 的 基本 思路 是 针对 测验 中 各 种 类 型 的 试题 ,构造 
出 不 同 的 试题 特征 函数 ,用 这 些 函 数 来 揭示 考生 的 试题 答对 率 与 考 
生 能 力 水 平 .试题 特征 间 的 定量 关系 。 

如 果 已 知 测验 卷 的 每 道 试题 参数 ,那么 根据 考生 的 作答 反应 ， 
运用 试题 反应 理论 可 以 估计 考生 的 能 力 水 平 。 具 体 方法 如 下 : 

【 例 1】 假设 某 测验 卷 由 5 道 客观 题 组 成 ,每 道 试题 都 是 两 级 
































计 分 (分 对 与 错 两 种 情况 ) ,各 道 试题 参数 与 考生 甲 的 作答 反应 情况 
如 表 1。 试 估计 考生 甲 的 能 力 水 平 。 
表 1 考生 甲 的 作答 情况 表 
试题 参数 
试题 试题 答对 率 | 甲 作 答 情况 
区 分 度 难度 猜测 度 
i | | a Pi (9) 1 
2 aa 加 区 PC9) 
3 a 加 P, C0) 0 
4 “| 要 P, (8) 了 
5 as 6 6 P, (9) 1 
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分 析 : 本 题 的 试题 反应 模型 是 单 维 三 参数 模型 ,根据 局 部 独立 
性 假设 ,出 现 作 答 情 况 4 = (1, 1, 0, 1, 1) 的 概率 就 等 于 这 五 道 试 
题 答 对 率 的 乘积 ,这 是 一 个 关于 能 力 水 平 9 的 函数 , 称 为 似 然 函 数 ， 
它 的 具体 表达 式 为 
Llu|0) = Pi(0)P, (0)[1— Ps(0)JP, (0)Ps (60), (4) 
考生 甲 的 能 力 水 平 估计 值 就 是 使 得 似 然 函 数 L(u19) 值 达到 极 
大 值 时 自 变量 9 的 取 值 。 利 用 似 然 函 数 达 到 极 值 时 估计 参数 9 值 的 
方法 称 为 极 大 似 然 估计 法 。 具 体 计算 步骤 如 下 ， 
首先 对 函数 (4) 两 边 取 对 数 , 得 到 对 数 似 然 函 数 如 下 ; 
lnL(x 19) = InPi(9) 十 lnP:(g) 十 ln[] 一 P:(b)] 
十 In P,(0) 十 ln P;(0)。 (5) 
其 次 , 令 式 (5) 的 一 阶 导 函 数值 为 零 , 即 可 得 到 关于 9 的 非 线性 
似 然 方程 如 下 : 
l,.7a1(P!— a) 
Pp 























RE 1.7as(P, — c,) _1.7a(P,—c) 
2 


1 一 万 





1.7ai(P 一 c) ， 17a(CP:, 一 ce) 
已 Ps 
= (6) 


然后 采用 牛顿 一 拉夫 逊 迭 代 法 求解 关于 9 的 非 线性 似 然 方程 
《6) ,这 一 步 需要 借助 计算 机 来 完成 , 即 可 得 到 考生 甲 的 能 力 水 平 估 
计 值 8。 

如 果 运 用 试题 反应 理论 指导 测验 编制 ,那么 试题 参数 的 估计 是 
必 不 可 少 的 工作 。 参 数 估 计 的 思路 如 下 ， 

第 一 步 , 首 先 编制 一 份 测验 卷 (共有 道 试题 ,假设 每 道 试题 都 
是 0 一 1 两 级 计 分 ), 并 组 织 m 个 考生 参加 测验 ,获取 所 有 考生 每 首 
试题 的 测验 分 数 ,得 到 如 表 2 所 示 的 分 数 矩 阵 。 
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表 2 分 数 和 矩阵 囊 


























试题 及 作答 情况 
总 分 
| 1 | 2 
和 这 是 0 2 
2 0 1 并 
考生 二 
m 1 . 0 1 Zn 














第 二 步 ,假设 考生 的 能 力 水 平 已 知 ,估计 每 道 试题 参数 。 这 时 ， 
可 以 依次 估计 每 道 试题 参数 ,基本 思路 如 下 : 

根据 表 2 中 的 列 分 数 向 量 ,类 比例 1, 得 到 试题 i 的 似 然 函数 
Li(u|ai, bi， ci) ,将 对 数 似 然 函数 In L(x|ai, bi;, ci) 分 别 对 参数 w、 
6b、ci 求 偏 导 ,并 令 其 值 为 零 ,可 以 得 到 关于 a;、6;、c; 的 三 元 方程 
组 ,然后 采用 牛顿 一 拉夫 逊 迭 代 法 求解 关于 a;、b;、c; 的 非 线性 方程 
组 , 即 可 得 到 试题 参数 的 估计 值 。 

如 果 考生 能 力 水 平 未 知 , 则 需要 同时 估计 考生 能 力 水 平和 每 首 
试题 参数 ,这 样 需要 估计 的 参数 共有 m 十 3n 个 。 解决 思 路 如 下 : 

首先 根据 分 数 矩 阵 表 得 到 每 个 考生 完成 测验 的 对 数 似 然 函 数 
ln Ly (ws | 0;，ai, bi, ci) ,然后 将 lnLi (ws | 0), a;, 总 ，c) 分别 对 0 
0 一 1 2 1) 与 ab cd 一 1 2，…, za) 求 偏 导 , 并 令 其 值 
为 零 ,可 以 得 到 关于 0G =1,2, mo) ai cd 二 1，2，…， 
7) 的 m 十 3n 元 方程 组 ,然后 采用 牛顿 一 拉夫 偿 迭 代 法 ,从 设 定 一 套 
参数 初 值 开始 ,经 过 反复 迭代 获得 一 组 解 序列 ,可 以 证 明 这 组 解 序 
列 最 终 收 敛 于 方程 组 的 真 解 。 








第 四 节 试题 反应 理论 的 优点 
试题 反应 理论 的 整个 理论 框架 和 分 析 方法 与 经 典 真 分 数理 论 、 
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概 化 理论 有 着 质 的 不 同 ,这 也 决定 了 试题 反应 理论 具有 以 下 独特 的 
优点 。 

1. 试题 参数 的 路 群体 不 变性 
在 试题 反应 理论 中 ,试题 参数 的 不 变性 指 衡量 试题 质量 的 各 个 
参数 (难度 ,区 分 度 与 猜测 度 等 ) 不 依赖 于 参加 测验 的 考生 样本 , 即 
试题 参数 不 因 考生 样本 的 不 同 而 不 同 。 对 于 试题 i, 根 据 试题 特征 
函数 Pb) ,能 力 水 平 为 & 的 考生 答对 试题 ;的 概率 仅仅 与 考生 能 
力 水 平 相关 ,而 与 考生 在 哪个 群体 无 关 , 也 与 考生 所 在 群体 的 大 小 
无 关 , 还 与 考生 在 群体 中 所 处 的 位 置 无 关 , 即 Pb) 的 大 小 由 9 值 叭 
一 确定 。 试 题 反应 理论 的 这 一 优点 为 建设 大 型 题库 .编制 各 种 测验 
提供 了 理论 依据 。 

2 能 力 参 数 的 跨 测验 不 变性 

在 试题 反应 理论 中 ,能 力 参数 的 不 变性 体现 为 在 同一 个 能 力量 
表 上 ,考生 能 力 的 大 小 与 所 施 测 的 特定 测验 卷 无 关 , 即 对 考生 能 力 
的 估计 不 因 测 验 改变 而 改变 。 在 试题 反应 理论 中 , 真 分 数 下 可 以 定 
义 为 工 一 去 忆 P. (0)( 又 称 为 测验 特性 函数 ), 其 中 是 测验 卷 中 的 


试题 总 数 ,P,(6) 是 试题 i 的 答对 率 ,9 是 能 力 参数 。 当 测验 卷 中 的 试 
题 参 数 确定 后 ,考生 真 分 数 工 就 完全 由 能 力 参 数 9 来 确定 ,无 论 测验 
卷 的 具体 试题 构成 如 何 , 只 要 满足 试题 参数 不 变 ,那么 测验 特性 函 
数 就 是 唯一 确定 的 , 即 能 力 参数 9 独立 于 测验 所 施 测 的 具体 试题 样 
本 ,并 决定 考生 在 各 个 具体 测验 上 的 真 分 数值 。 试 题 反 应 理论 的 这 
一 优点 为 针对 不 同 水 平 的 考生 实施 题目 不 同 的 测验 .建设 自 适应 测 
验 黄 定 了 理论 和 方法 基础 。 

3 能力 参 数 与 试题 难度 参数 的 直接 可 比 性 

试题 反应 理论 把 试题 难度 参数 定义 为 试题 特征 曲线 上 拐点 的 
横 坐标 , 即 把 难度 看 成 能 力 尺 度 上 的 位 置 参数 ,这 说 明 能 力 参数 与 
试题 难度 参数 位 于 同一 度量 系统 上 。 同 时 ,试题 反应 理论 还 直接 用 
能 力 参数 与 难度 参数 的 对 比 , 即 (9 一 5) 作为 揭示 考生 答对 试题 概率 
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高 低 的 根本 原因 ,从 而 引导 人 们 选择 恰当 难度 的 试题 去 最 有 效 地 开 
展 测试 ,为 测验 等 值 .试题 有 偏 性 探查 等 问题 提供 了 解决 途径 。 

4. 试题 区 分 度 参 数 与 难度 参数 的 相互 独立 性 

根据 试题 特征 线 ,难度 参数 是 曲线 拐点 的 横 坐 标 ; 而 区 分 度 
参数 由 曲线 在 拐点 处 斜率 决定 ,与 拐点 的 位 置 无 关 , 四 与 难度 参数 
无 关 。 试 题 反 应 理论 的 这 一 性 质 为 在 任何 难度 水 平 上 选择 高 区 分 
度 试题 提供 了 保证 。 

5. 试题 与 测验 信息 函数 的 引进 

试题 反应 理论 还 引进 了 如 下 全 新 的 概念 :试题 信息 函数 与 测验 
信息 函数 。 试 题 信息 函数 、 测 验 信息 函数 分 别 定义 如 下 ; 


(P'(6)) 
B01 — P60))" 


















































了 一 (7) 


1(0) = 2)1.(0)。 (8) 
i=l 


式 (7) 中 ,1,(9) 为 试题 i 的 信息 函数 , P,(6) 为 试题 让 的 答对 率 。 
式 (8) 中 I(9) 表 示 整 份 测验 卷 的 信息 函数 。 
式 (7) 针 对 每 个 能 力 水 平定 量 地 刻画 出 试题 难度 、 区 分 度 、 猜 测 
度 是 如 何 共同 决定 试题 的 测试 功能 , 它 表 明 每 道 试题 提供 的 信息 量 
既 与 考生 能 力 水 平 有 关 , 也 与 试题 自身 性 能 特点 相关 ,但 与 其 他 试 
题 无 关 。 因 此 ,试题 信息 函数 具有 可 加 性 ,从 而 得 到 测验 信息 函数 
是 所 含 全 部 试题 信息 函数 之 和 , 即 式 (8) 。 
相应 地 ,试题 测量 标准 误 、 测 验 卷 测量 标准 误 分 别 为 
1 
VE 
1 
VI@ 


从 上 述 定义 可 以 看 出 ,试题 反应 理论 中 的 测量 标准 误 不 仅 与 参 
测 的 试题 性 质 有 关 , 还 与 参 测 的 考生 能 力 水 平 有 关 。 即 用 相同 试题 











SE 0 = 





， 《9) 





SEC0) = (10) 
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对 不 同 的 考生 施 测 , 其 测验 误差 并 不 相同 。 这 就 为 准确 估计 每 个 考 
生 能 力 水 平 提供 了 准确 信息 ,也 为 控制 不 同 能 力 水 平 考生 的 测量 误 
差 提供 了 标准 ,还 为 测验 试题 编制 提供 了 一 种 新 型 的 ,切实 可 行 的 
选 题 策略 。 











第 五 节 试题 反应 理论 的 局 限 








虽然 试题 反应 理论 得 到 广泛 的 重视 ,但 是 目前 该 理论 的 应 
存在 许多 困难 ,这 主要 源 于 该 理论 存在 的 一 些 局 限 性 ,主要 体现 
以 下 四 个 方面 。 

1， 单 维 性 假设 不 一 定 能 得 到 满足 

目前 ,常见 的 试题 反应 模型 都 有 单 维 性 假设 , 即 假设 只 有 一 种 
能 力 起 决定 性 作用 ,而 其 他 能 力 可 以 忽略 不 计 。 但 在 教育 测验 中 ， 
人 们 对 学 科 知识 的 理解 与 掌握 需要 人 靠 平时 知识 的 积累 与 学 习 , 也 应 
具有 多 方面 的 能 力 。 因 此 ,试题 反应 理论 的 单 维 性 假设 在 应 用 时 不 
一 定 能 够 得 到 满足 ,事实 上 ,不 少 学 者 在 研究 成 果 中 给 出 了 这 方面 
的 案例 ,例如 ,指出 语文 高 考 测验 不 能 满足 单 维 性 假设 .9 

当 某 些 科目 不 满足 单 维 性 假设 时 ,可 以 设想 把 整个 科目 分 解 成 
若干 个 分 测验 ,使 每 一 个 分 测验 能 满足 必须 得 到 满足 的 假设 ,再 应 
用 试题 反应 理论 进行 试题 分 析 。 这 样 做 ,又 可 能 引起 另外 一 些 问 
题 , 如 各 个 分 测验 题目 量 的 大 小 ,分 测验 之 间 分 数 的 合成 等 ,这 些 问 
题 有 待 进一步 解决 。 

2. 对 数学 模型 与 实测 数据 的 拟 合 度 要 求 较 高 

试题 反应 理论 的 核心 是 构建 数学 模型 分 析 试 题 性 质 、 考 生 能 力 
水 平 与 试题 作答 情况 的 关系 ,数学 模型 的 好 坏 直 接 影响 研究 质量 。 
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四 ” 张 敏 强 , 刘 晓 瑜 ,项 目 反应 模型 的 应 用 问题 研究 ,心理 学 报 ,1998 年 10 月 ,436 一 
441 页 。 
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在 实际 应 用 中 ,如何 选择 适当 的 数学 模型 ,如 何 检验 实测 数据 与 模 
型 的 拟 合 度 ,都 是 试题 反应 理论 中 备 受 关注 的 重大 问题 。 

3. 计算 工作 量 太 大 ,计算 过 程 复 杂 

根据 前 面 的 分 析 ,试题 反应 理论 的 理论 框架 虽然 比 经 典 真 分 数 
理论 . 概 化 理论 更 为 合理 ,但 是 涉及 的 计算 原理 专业 性 强 , 不 易 为 普 
通 教育 者 理解 ; 且 计 算 过 程 复杂 ,计算 量 太 大 ,在 普通 教育 教学 领域 
的 应 用 与 推广 具有 一 定 的 局 限 性 。 

4. 对 主观 性 试题 的 测量 与 评价 有 待 开发 

目前 ,试题 反应 理论 在 单位 特质 测量 与 双 歧 评分 试题 研究 方面 
已 经 比较 成 熟 ,但 在 多 维特 质 测量 、 多 级 评分 试题 测试 等 方面 的 研 
究 与 应 用 还 很 有 限 , 还 远 远 不 能 满足 各 方面 测验 发 展 的 需要 。 
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